LLM 相關三個月內文章 / 第 63 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這段文字探討建立理論框架以理解智慧的重要性,無論是人工智慧還是生物智慧。作者認為良好的數學理論能預測物理現實,並隨時間修正。使用玩具模型作為隱喻,有助於簡化複雜系統的理解。文中列出創建智慧理論的八大挑戰,包括表徵學習、泛化能力、對抗穩健性等。總體來說,這強調自下而上的智慧建模方法,解決這些挑戰將有助於深化我們對智慧的理解。 相關文章 PubMed DOI

這項研究評估了四個大型語言模型(LLMs)在生成中國患者對乾眼症問題的回應表現。研究分為兩個階段,第一階段由六位眼科醫生根據正確性、完整性、可讀性、有用性和安全性對回應進行評分。結果顯示,GPT-4在各方面表現最佳,但可讀性較低。第二階段中,46位患者向GPT-4和Baichuan 2提問,發現GPT-4的完整性較高,但Baichuan 2的回應更易理解。整體而言,這些模型在提供乾眼症相關資訊上展現了潛力,對中國患者意義重大。 相關文章 PubMed DOI

最近在自然語言處理和人工智慧的進展,使大型語言模型(LLMs)在自動化作文評分(AES)中應用更為廣泛,提供高效且無偏見的評估。本研究評估了LLMs在AES中的可靠性,特別是評分的一致性及其與人類評審者的對齊程度。結果顯示,提示工程對LLMs的可靠性至關重要,且GPT-4的表現優於其他模型,尤其在「想法」和「組織」維度上表現突出。研究建議未來應擴展到不同寫作類型和參與者,以深入了解LLMs在教育中的影響。 相關文章 PubMed DOI

這篇文章探討大型語言模型(LLMs)產生的「不負責任言論」問題,這可能對科學、教育及民主社會的知識完整性造成長期風險。LLMs雖然常給出看似合理的回應,但可能包含不準確或偏見,影響知識品質。作者分析了對LLM提供者施加法律責任的可能性,並檢視歐盟的《人工智慧法》和《數位服務法》,指出目前對真實性義務的限制。文章也提到德國一案例,建議透過法律責任來減少不負責任言論,確保輸出與事實一致。 相關文章 PubMed DOI

這項研究評估了多模態人工智慧模型在NEJM影像挑戰中的表現,並與人類集體智慧進行比較。結果顯示,人工智慧在臨床診斷上有潛力,但也有其限制。Anthropic的Claude 3系列在準確性上超越了人類平均水平,但人類集體決策的表現仍優於所有人工智慧模型。此外,GPT-4 Vision Preview在較簡單問題上反應更有效,特別是對小圖像和長文字的問題。 相關文章 PubMed DOI

這項研究探討了故事回憶評分中的個體差異,特別是中心細節和周邊細節的區分是否必要,以及評分是否能自動化。結果顯示,中心記憶和周邊記憶的得分高度相關,單一得分可能足夠評估記憶表現。此外,使用BERTScore和GPT-4的自動評分方法與人工評分之間有強相關性,顯示自動化評分的潛力。不過,自動化方法的得分分佈存在不一致,需進一步研究。總體而言,研究建議心理學家可在保持準確性的同時簡化評分方式。 相關文章 PubMed DOI

這項研究評估了新推出的AI模型Claude 3 Opus在診斷和規劃頭頸部鱗狀細胞癌(HNSCC)治療的效果,並與ChatGPT 4.0進行比較。研究於2024年3月進行,涵蓋50例HNSCC病例,並將AI模型的建議與傳統的多學科腫瘤委員會(MDT)建議進行對比。結果顯示,Claude 3 Opus在診斷準確性上優於ChatGPT 4.0,且提供的治療建議與MDT一致。雖然在臨床建議和解釋方面表現相當,但Claude 3未引用資訊來源。總體而言,Claude 3 Opus顯示出作為診斷工具的潛力,建議在臨床環境中使用。 相關文章 PubMed DOI

認知科學家一直在研究人類概念的表徵方式,尋找能有效計算相似性、特徵、類別等屬性的方法。這種表徵應能促進理論創建和知識發展。近來,基於向量的表徵成為熱門選擇,特別是在大型語言模型的進展下。這些向量能處理複雜屬性,如組合性和結構關係,顯示出它們在神經架構中可能有效編碼類似人類的概念理解。 相關文章 PubMed DOI

這項研究探討了不同人工智慧模型在精神醫學診斷的表現,包括GPT-3.5、GPT-4、Aya和Nemotron。由於病人主觀報告的影響,準確診斷常常困難。研究使用20個DSM-5的臨床案例,結果顯示GPT-3.5和GPT-4在準確性和推理上優於其他模型,尤其在診斷精神病和雙相情感障礙方面表現突出,但在某些情況下則不佳。研究建議,人工智慧有潛力改善精神科診斷,但其他模型需進一步改進,未來應擴展數據集以增強診斷能力。 相關文章 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)預測蛋白質相變(PPTs),對於理解與年齡相關的疾病如阿茲海默症非常重要。研究者微調了一個LLM,評估蛋白質序列變異對PPTs的影響,結果顯示該模型的表現超越傳統方法,並結合隨機森林模型提升可解釋性。此外,研究發現阿茲海默症相關蛋白質的聚集增加與基因表達下降有關,暗示可能存在自然防禦機制來對抗該疾病。 相關文章 PubMed DOI