LLM 相關三個月內文章 / 第 143 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,ChatGPT-4.0在回答人工水晶體相關問題時,對簡單題目的準確率很高,但遇到難題時表現就明顯下滑。經過六個月,回答內容變得更長、更精確,評分也有提升。簡單問題的再現性很好,但複雜問題的一致性還有待加強。整體來說,ChatGPT-4.0在醫療資訊領域有潛力,但要更可靠還需要再優化。 相關文章 PubMed DOI 推理

這項研究用AI工具(像是ChatGPT)分析社區會議紀錄,發現當討論用藥物治療鴉片類藥物使用障礙時,污名議題被提到的次數明顯增加。若社區有較多族群多元,特別是談到種族差異時,污名相關討論也更多。這顯示AI能幫助社區研究快速做質性分析。 相關文章 PubMed DOI 推理

這項研究比較ChatGPT-3.5、ChatGPT-4和Gemini在產生早產兒視網膜病變衛教資料的表現。三款AI都能產出正確、易懂的內容,但ChatGPT-4在將資料改寫成國中一年級程度時,品質和可靠性最好。整體來說,ChatGPT-4特別適合協助家長取得高品質、易讀的衛教資訊。 相關文章 PubMed DOI 推理

這項研究發現,像 Llama-2-70b-chat 和 GPT-3.5 這類大型語言模型,在描述282種遺傳疾病的年齡相關特徵時表現不錯,尤其有情境提示時更佳,且沒明顯年齡偏見。不過,雖然這些模型有潛力協助臨床應用,實際使用上還是有一些限制需要注意。 相關文章 PubMed DOI 推理

這項研究發現,AI大型語言模型在婦產科診斷上,整體表現比住院醫師更好,尤其在時間壓力大或不同語言時更明顯。最強的AI模型診斷準確率高達88%,而住院醫師平均只有65%,且年資越高表現越好。AI對資淺醫師幫助最大,能大幅提升診斷正確率。整體來說,AI有助於提升婦產科訓練和臨床診斷的準確性與穩定性。 相關文章 PubMed DOI 推理

這項研究發現,根據個人特質分配結對程式設計角色,能讓小型、資源有限的軟體團隊內在動機提升六成以上。像是開放性高的人適合當 Pilot,外向或親和的人適合當 Navigator,神經質則適合 Solo。ROMA 框架有助於團隊更有效分工,提升協作和滿意度。雖然目前只針對 Z 世代大學生,但未來有機會推廣到職場和 AI 協作。 相關文章 PubMed DOI 推理

這項研究開發了一套透明化的社群媒體仇恨言論偵測系統,運用先進語言模型(如 Mistral-7B)來清楚標示並解釋判斷依據。經多組資料集測試,這方法不只提升自動審查的準確率,也讓判斷過程更容易被理解與信任。 相關文章 PubMed DOI 推理

這項研究用 TripAdvisor 和 Twitter 的評論,分析遊客對景點的情感。經過資料處理後,分別用 TF-IDF 和 BERT 兩種方法做情感分析。結果發現,BERT 模型準確率最高(83.5%),對觀光管理和行銷推廣很有幫助。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4在協助篩選食道切除術併發症危險因子的文獻時,和人工審查者的判斷一致率高,尤其在標準較寬鬆時表現更好。雖然標準嚴格時準確率會下降,但GPT-4仍能有效簡化流程並提供決策依據。未來建議進一步比較不同模型及應用於其他審查步驟。 相關文章 PubMed DOI 推理

這篇研究針對土耳其語拼字校正,建立了新資料集NoisyWikiTr,並比較BERT編碼器和T5編碼器-解碼器模型。結果顯示,能理解語境、針對語言設計的序列到序列模型,修正真實土耳其語拼字錯誤的效果,比傳統工具和一般模型都更好。 相關文章 PubMed DOI 推理