LLM 相關三個月內文章 / 第 88 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究評估了ChatGPT-3.5和ChatGPT-4.0在回答2018至2022年日本醫學物理師考試問題的表現。結果顯示,ChatGPT-4.0的正確率為72.7%,明顯高於ChatGPT-3.5的42.2%。不過,兩者在輻射計量及輻射相關法律和醫學倫理方面的表現較差,正確率分別為55.6%和40.0%。這些結果為ChatGPT在醫學物理領域的應用提供了基準,並可作為開發相關工具的參考,特別是在日本的放射治療支持上。 相關文章 PubMed DOI

這項研究探討Snapchat的My AI在提供性健康資訊給年輕人的有效性,特別是性同意、拒絕、性侵害和傳送性暗示訊息。研究者向My AI提出標準化問題,分析其回應的一致性。結果顯示,My AI強調清晰溝通的重要性,並建議在面對性侵害或性暗示問題時諮詢可信的照顧者。雖然回應大致一致,但仍有變異,顯示教育者需補充數位工具,以確保年輕人能全面理解和獲得支持。 相關文章 PubMed DOI

人工智慧(AI)在醫療領域的應用日益增多,尤其是在臨床決策和教育方面。針對胚胎移植,我們請九個聊天機器人撰寫300字的科學論文,探討改善成功率的方法。結果顯示,雖然總共提出43條建議,但只有3條(15.8%)是基於堅實證據。有效的建議包括「超聲引導胚胎移植」、「單胚胎移植」和「使用柔性導管」。相對地,一些有爭議的建議如「植入前基因檢測」則被頻繁提及。研究結果顯示,現有AI在提供可靠建議方面仍有待加強,患者和醫生需謹慎對待這些建議。 相關文章 PubMed DOI

這篇論文提供了一個詳細的指南,旨在將人工智慧(AI)技術融入傳統東亞醫學(TEAM)的研究中。它說明了AI模型開發的關鍵步驟,包括設定研究目標、數據收集與預處理、選擇合適模型,以及結果的評估與解釋。論文探討了TEAM數據集面臨的挑戰,如數據稀缺與不平衡問題,並強調模型可解釋性的重要性。還提供了實用建議,並討論大型語言模型在TEAM研究中的潛力。最後,強調了AI在TEAM領域的挑戰與未來展望,以及建立標準化數據平台的必要性。 相關文章 PubMed DOI

這篇論文介紹了一個創新的低成本模擬駕駛評估系統,搭載語音助手,利用生成式人工智慧進行即時互動。這種模擬器提供比傳統實地評估更安全且可自訂的選擇,解決了高成本的問題。系統旨在提升駕駛者的情境意識,並促進正向情緒,幫助識別需要進一步評估的駕駛者。初步結果顯示,與語音助手互動的參與者在駕駛表現和情緒狀態上都有所改善。 相關文章 PubMed DOI

深度學習光學字符識別(OCR)在提取圖像文本方面發展迅速,但針對古代阿拉伯手稿的數據集卻相對不足,這對研究者來說是一大挑戰。為了解決這個問題,我們創建了一個包含來自麥地那伊斯蘭大學中央圖書館的八本古書、四十頁圖像及其專家轉錄文本的數據集。這些手稿展現了阿拉伯文學的多樣性,對於阿拉伯OCR的研究和模型開發至關重要。我們希望透過公開這個數據集,能夠提升古代手稿的文本識別準確性,並支持相關研究。 相關文章 PubMed DOI

這項研究探討大型語言模型(LLMs)在醫療領域的倫理問題,特別是臨床醫師的看法。研究分析了3,049則來自醫師討論區的帖子,找出14個關鍵主題,分為四大類:LLMs的倫理問題、算法治理、對健康公平的影響,以及使用者與LLM的互動。分析指出了決策透明度、公平性、隱私等複雜議題。研究呼籲持續進行倫理評估,並建議針對LLMs的使用制定專門的治理,以提升臨床結果的倫理性。 相關文章 PubMed DOI

這項研究探討了微調開源大型語言模型(LLMs)在醫學證據總結方面的潛力,與專有模型相比,開源模型雖然表現較弱,但提供了更高的透明度和自訂性。研究人員使用MedReview基準數據集對三個流行的開源LLMs進行微調,結果顯示微調後的LongT5在零樣本設定中接近GPT-3.5的表現,且一些小型微調模型甚至超越了大型零樣本模型。這些改進在人工評估和模擬GPT-4的評估中均有明顯體現。 相關文章 PubMed DOI

EnzChemRED是一個新資料集,旨在透過自然語言處理技術,提升從科學文獻中提取酶相關資訊的能力。該資料集包含1,210篇專家策劃的PubMed摘要,並標註了酶及其化學反應的識別碼。研究顯示,使用EnzChemRED微調的語言模型在識別蛋白質和化學物質方面表現優異,F1分數達86.30%。此外,這些模型在提取化學轉換和相關酶的能力也相當強大,為酶功能的策劃提供了有力支持。 相關文章 PubMed DOI

這項研究評估了多種大型語言模型(LLMs)在協助醫生對放射治療保險拒絕上訴的表現。測試的模型包括GPT-3.5、GPT-4及其具網路搜尋能力的版本。研究使用20個模擬病歷進行評估,結果顯示GPT-3.5、GPT-4和GPT-4web能產生清晰且具臨床相關性的上訴信,對加速上訴過程有幫助。相對而言,經微調的GPT-3.5ft表現較差,且所有模型在引用文獻時均有困難。整體而言,LLMs可減輕醫生的文書負擔,但小型數據集微調可能影響性能。 相關文章 PubMed DOI