LLM 相關三個月內文章 / 第 1 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

常識推理在人工智慧中是一大挑戰,特別是在可行性評估方面。由於這個領域尚未深入研究,人類標註的基準對進展至關重要。這篇文章介紹了如何透過亞馬遜機械土耳其進行大規模眾包,重新標註SemEval-2020任務4的常識可行性數據集。我們收集了10,000個標註,涵蓋2,000個句子,並對其進行多重標註。還評估了GPT-3.5和GPT-4模型的表現,並將其標籤與人類標註者進行比較。這個數據集將成為分析人類與機器常識推理的重要資源,支持AI研究的發展。 相關文章 PubMed DOI

隨著ChatGPT等生成式人工智慧技術的興起,醫療等關鍵領域的倫理問題愈發受到關注,但討論尚未產生實質解決方案。此外,許多對話忽略了合成影像等其他生成式AI技術,這些技術可能帶來新的倫理挑戰。為了填補這些空白,我們進行了醫療領域生成式AI倫理的範疇回顧,並創建了一個檢查清單,以評估生成式AI研究中的倫理考量。這個檢查清單可納入同行評審及出版過程,提升研究質量,並促進AI驅動產品在醫療等領域的倫理披露。 相關文章 PubMed DOI

這項研究評估了GPT-4o在歐洲放射學委員會考試中的表現,結果顯示它在選擇題和短案例問題上超過了平均放射科醫生的分數(70.2%對58.4%)。不過,在臨床推理部分,GPT-4o的得分低於平均及及格分數(52.9%對66.1%)。該模型在超聲影像問題上表現優異(87.5-100%),但在影片問題上則較差(50.6%)。整體來看,這項研究顯示大型語言模型如GPT-4o在協助放射科醫生方面的潛力。 相關文章 PubMed DOI

健康教育材料的閱讀水平對於少數族裔群體的資訊理解至關重要。許多病人教育資源過於複雜,顯示出需要有效的文本簡化模型,特別是在癌症教育中。為此,我們建立了簡化消化道癌症(SimpleDC)語料庫,包含來自美國癌症協會和CDC的教育材料,提供原始和簡化版本,共1183對句子供研究使用。我們探索了基於大型語言模型的簡化方法,並發現RL/RLHF技術能有效提升模型性能,特別是在癌症教育領域。SimpleDC語料庫將成為研究人員的重要資源。 相關文章 PubMed DOI

抑鬱症對全球影響深遠,影響工作效率和殘疾率。雖然早期發現很重要,但現有的篩檢工具常缺乏客觀性。研究者正探索影像分析、血液標記及日記寫作等客觀指標。這項研究利用情感日記應用程式,評估91名參與者的日記文本,並使用GPT-3.5和GPT-4等大型語言模型進行抑鬱症檢測。結果顯示,微調後的GPT-3.5準確率達90.2%,顯示用戶生成的文本在臨床檢測抑鬱症上具潛力,未來可結合其他可測量指標進一步研究。 相關文章 PubMed DOI

隨著像ChatGPT這樣的AI工具在學術研究中的普及,關於作者身份和透明度的討論愈加重要。這篇評論強調需要建立一個標準化的AI貢獻分類法,以明確AI在研究中的角色。透過調整NIST的分類法,新增假設生成、數據分析等任務類別,可以提升研究的透明度和問責制。這樣的分類法能解決目前AI貢獻披露的不一致,幫助區分AI與人類的任務,促進符合倫理標準的報告,最終增進對AI在研究中使用的信任,維護學術誠信。 相關文章 PubMed DOI

II類微菌素是一種有潛力的新型抗生素,但目前識別的數量有限。本研究探討利用蛋白質大型語言模型的數值嵌入來檢測細菌基因組中的微菌素,並與傳統的序列比對方法(如BLAST)進行比較。結果顯示,嵌入法在識別已知II類微菌素上更有效,還能發現一些傳統方法忽略的新型微菌素。隨著抗生素抗藥性問題日益嚴重,發現新的抗菌肽至關重要,這項研究為對抗細菌感染提供了新策略。 相關文章 PubMed DOI

放射科醫師對生成式人工智慧和大型語言模型的看法各有不同,受實踐環境影響。有些醫師認為這些技術能提升診斷準確性、簡化流程及改善病人照護,特別是在影像分析和報告生成方面。然而,也有醫師擔心人工智慧結果的可靠性、工作取代及倫理問題。醫師對這些工具的接受度受訓練程度、對技術的熟悉度及機構支持等因素影響。總之,這些新技術的實施需謹慎考量其優缺點,並強調醫師與開發者之間的合作與教育。 相關文章 PubMed DOI

這篇文章探討了基於概率的估計在預測精神病患者自殺風險上的限制,並建議採用博弈論的策略來改善醫生與患者的互動,進而提升治療效果和降低自殺風險。文章還指出大型語言模型在量化患者臨床決策的潛力,並強調記錄這些決策的重要性,以確保每次患者互動都能維持高品質的護理標準。 相關文章 PubMed DOI

這項研究指出,網路醫療資訊在骨科領域的使用越來越普遍,但也面臨品質挑戰。研究評估了25個網站,並針對10個網站使用髖部資訊評分系統(HISS)進行分析。最初的平均分數為9.5,顯示品質不佳。經過ChatGPT的建議後,分數提升至21.5,顯示出優秀的品質。結果顯示,ChatGPT能顯著改善線上病人資訊的品質,成為骨科醫生創建教育材料的有力工具,雖然無法取代專業知識,但能提升醫療資訊的可及性與品質。 相關文章 PubMed DOI