LLM 相關三個月內文章 / 第 16 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

隨著籃球越來越受歡迎,許多球迷在快速且複雜的比賽中感到難以跟上。為了解決這個問題,我們推出了Sportify,一個視覺問答系統,幫助球迷理解籃球戰術。Sportify提供三種動作視覺化—傳球、切入和掩護,並利用大型語言模型來解釋球員的行動。我們測試了Sportify的效果,結果顯示它顯著提升了球迷的戰術理解,並豐富了觀賽體驗,特別是第三人稱敘述提供了詳細解釋,而第一人稱則增強了參與感。 相關文章 PubMed DOI

這篇論文介紹了KNOWNET,一個結合大型語言模型(LLMs)和知識圖譜(KGs)的視覺化系統,旨在提升健康資訊的準確性和探索性。它針對LLMs可能產生的錯誤資訊,透過提取結構化數據並與外部KGs驗證來降低風險。KNOWNET還提供結構化探索功能,根據KGs中的相關實體建議後續步驟,幫助使用者深入了解健康主題。此外,系統具備漸進式圖形視覺化功能,能追蹤過去查詢並連結當前查詢與建議。其有效性透過使用案例和專家訪談得以證實。 相關文章 PubMed DOI

這篇論文探討了VILA管道的開發,該管道能自動生成多選視覺化項目,以評估視覺化素養。作者創建了1,404個候選項目,涵蓋12種圖表類型和13種視覺化任務,並與專家合作制定評估規則,最終形成約1,100個高品質的VILA資料庫。研究指出VILA管道的局限性,強調人類監督的重要性。此外,作者還開發了VILA-VLAT測試,顯示出良好的效度。最後,論文提供了對VILA的應用建議及實用指導,相關材料可在線獲取。 相關文章 PubMed DOI

LLM Comparator 是一款視覺分析工具,透過並排比較來提升對大型語言模型(LLMs)的評估。它解決了 LLM 評估中可擴展性和可解釋性的問題,讓使用者能分析為何某模型表現優於另一模型。這工具與 Google 專業人士合作開發,提供深入分析個別範例的流程,並讓使用者視覺化探索數據,識別模式、形成假設,並獲得改進模型的見解。LLM Comparator 已整合進 Google 的評估平台,並開源供更多人使用。 相關文章 PubMed DOI

這項研究聚焦於醫療領域的提示工程,探討其如何提升大型語言模型(LLMs)處理複雜醫療文本的能力。研究回顧了114篇2022至2024年間的相關文獻,發現提示設計(PD)是最常用的方法,且ChatGPT是最受歡迎的LLM。思考鏈技術被廣泛應用,但有61%的研究未報告基準,影響有效性評估。研究旨在提供醫療提示工程的現狀,識別機會與挑戰,並提出未來研究的指導方針。 相關文章 PubMed DOI

這項研究評估了ChatGPT在診斷結腸癌的能力,特別是比較GPT-3.5和GPT-4.0的表現。研究分析了286份腸癌病例,結果顯示GPT-4.0在初診和次診的準確率均高於GPT-3.5,分別為0.972對0.855和0.908對0.617。雖然GPT-4.0在處理病史和實驗室數據上有所改善,但在識別症狀方面仍有挑戰。整體而言,GPT-4.0在臨床輔助診斷中展現出潛力,但仍需進一步研究以克服其限制。 相關文章 PubMed DOI

這項研究評估了ChatGPT-3.5和ChatGPT-4.0在回答2018至2022年日本醫學物理師考試問題的表現。結果顯示,ChatGPT-4.0的正確率為72.7%,明顯高於ChatGPT-3.5的42.2%。不過,兩者在輻射計量及輻射相關法律和醫學倫理方面的表現較差,正確率分別為55.6%和40.0%。這些結果為ChatGPT在醫學物理領域的應用提供了基準,並可作為開發相關工具的參考,特別是在日本的放射治療支持上。 相關文章 PubMed DOI

這項研究探討Snapchat的My AI在提供性健康資訊給年輕人的有效性,特別是性同意、拒絕、性侵害和傳送性暗示訊息。研究者向My AI提出標準化問題,分析其回應的一致性。結果顯示,My AI強調清晰溝通的重要性,並建議在面對性侵害或性暗示問題時諮詢可信的照顧者。雖然回應大致一致,但仍有變異,顯示教育者需補充數位工具,以確保年輕人能全面理解和獲得支持。 相關文章 PubMed DOI

人工智慧(AI)在醫療領域的應用日益增多,尤其是在臨床決策和教育方面。針對胚胎移植,我們請九個聊天機器人撰寫300字的科學論文,探討改善成功率的方法。結果顯示,雖然總共提出43條建議,但只有3條(15.8%)是基於堅實證據。有效的建議包括「超聲引導胚胎移植」、「單胚胎移植」和「使用柔性導管」。相對地,一些有爭議的建議如「植入前基因檢測」則被頻繁提及。研究結果顯示,現有AI在提供可靠建議方面仍有待加強,患者和醫生需謹慎對待這些建議。 相關文章 PubMed DOI

這篇論文提供了一個詳細的指南,旨在將人工智慧(AI)技術融入傳統東亞醫學(TEAM)的研究中。它說明了AI模型開發的關鍵步驟,包括設定研究目標、數據收集與預處理、選擇合適模型,以及結果的評估與解釋。論文探討了TEAM數據集面臨的挑戰,如數據稀缺與不平衡問題,並強調模型可解釋性的重要性。還提供了實用建議,並討論大型語言模型在TEAM研究中的潛力。最後,強調了AI在TEAM領域的挑戰與未來展望,以及建立標準化數據平台的必要性。 相關文章 PubMed DOI