LLM 相關三個月內文章 / 第 30 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究比較五款主流大型語言模型,發現雖然大家都建議看醫生,但在文化敏感度、內容深度和關鍵字完整性上差異很大。Grok對少數族群最貼心,Meta AI則幾乎沒做調整。沒有任何一款模型能全面涵蓋所有族群的乾眼症成因,顯示醫師監督和資訊標準化很重要,才能確保AI醫療資訊公平又正確。 相關文章 PubMed DOI 推理

這項研究發現,Whisper自動語音辨識系統在評估英語唐氏症患者的語音清晰度時,表現接近一般人類聽眾,特別是在單字辨識上。不過,對於希伯來語患者,ASR的準確度明顯較低,顯示未來臨床應用英語可行性高,但希伯來語還需進一步優化。 相關文章 PubMed DOI 推理

這項研究比較不同版本的 ChatGPT 在牙科全口 X 光片上計算牙齒數量和測量剩餘骨高度的表現。結果顯示,ChatGPT 4.5、o3 和 o4-mini-high 在牙齒計數上跟臨床醫師很接近,但 o1 準確度較差。不過,所有模型在骨高度測量都偏高估,目前還不適合臨床診斷牙周病。 相關文章 PubMed DOI 推理

這項研究發現,像ChatGPT這類AI生成的頭頸部超音波選擇題,品質跟醫師寫的差不多,但還是比專家審核過的題目略差。AI能幫忙快速出題,節省時間,但正式用前還是要專家把關,無法完全取代人類專業。 相關文章 PubMed DOI 推理

這項研究調查沙烏地阿拉伯79位放射科醫師,發現他們普遍支持用ChatGPT-4產生、適合病人閱讀的放射科報告,尤其是乳房攝影報告最受肯定。不過,MRI報告容易讓病人焦慮,醫師建議語言要更清楚、安心。整體來說,報告若有摘要、術語解釋和說明,醫師接受度更高。 相關文章 PubMed DOI 推理

BASIL DB 是一個線上知識圖譜資料庫,整理超過 43,000 篇論文,結合食物、生物活性化合物和健康效益的資訊。它用自然語言處理技術,讓使用者能互動式查詢食物與健康的關聯,對營養學和疾病預防研究很有幫助。 相關文章 PubMed DOI 推理

這篇論文提出一套結合區塊鏈和大型語言模型的健康保險詐欺偵測系統,能安全儲存醫療紀錄並用AI分析詐欺行為。系統支援自然語言查詢,偵測準確率高達99%,速度快又安全,且已開源,方便業界應用。 相關文章 PubMed DOI 推理

MDKG 是由 AI 建構的精神疾病知識圖譜,把分散的精神健康資料整合成一個網絡,涵蓋超過一千萬筆關聯(其中一百萬筆是新發現)。它包含人口統計和共病等細節,有助於加快專家審查,提升精神疾病預測,對精神醫學研究和臨床應用都很有幫助。 相關文章 PubMed DOI 推理

研究人員用眼動追蹤和反應時間等線上閱讀測量,來研究語境對單字處理的影響。雖然量化語境影響不容易,但現在可以用大型語言模型(LLMs)來估算單字出現機率,進而算出熵和驚異度這些指標。這些指標能反映閱讀難度,研究也會檢驗它們是否能預測人類閱讀行為。這篇綜述整理了LLM指標在解釋閱讀數據上的表現,並討論其研究意義。 相關文章 PubMed DOI 推理

SREDH/AI CUP 2023 競賽評估 LLM 在病理報告去識別化和日期標準化的表現,頂尖隊伍 macro-F1 分數都超過 0.8。微調 LLM(特別是低秩適應)能提升效果,但超大型模型容易過度擬合。資料增強、訓練策略和混合方法都很重要。醫療應用 LLM 時,需兼顧效能與隱私、法律和倫理規範。 相關文章 PubMed DOI 推理