原始文章

這項研究探討了GPT-4在評估藥物對肝臟、心臟和腎臟健康的毒性時的可靠性,並將其結果與FDA藥物標籤的專家評估進行比較。研究使用了兩種提示方式:一般提示和專家提示。結果顯示,專家提示的準確率(64-75%)高於一般提示(48-72%),但兩者的表現都只是中等。這提醒我們在公共健康應用中使用GPT-4時需謹慎,並建議採用檢索增強生成(RAG)等先進框架來提升其可靠性。 PubMed DOI


站上相關主題文章列表

這項研究評估了ChatGPT-4在社區藥局的表現,包括藥物資訊檢索、標籤錯誤識別、處方解讀及決策支持等。結果顯示,ChatGPT對藥物查詢的回應相當滿意,能引用正確的藥物數據,並成功識別標籤錯誤。在臨床情境中,其建議與藥師相當,特別是在藥物反應評估和健康建議方面。研究指出,ChatGPT可能成為社區藥局的有用工具,但仍需進一步驗證其在不同查詢和病人群體中的有效性及隱私問題。 PubMed DOI

這項研究評估了OpenAI的ChatGPT-3.5和GPT-4在台灣國家藥師執照考試的表現。結果顯示,GPT-4的準確率為72.9%,明顯優於GPT-3.5的59.1%。在基礎科目中,GPT-4得分更高,顯示其在臨床藥學和教育上的潛力。不過,研究也提醒使用者需謹慎,因為模型仍有局限性。未來應著重改進模型的穩定性和問題設計,以更有效評估學生能力。 PubMed DOI

這項研究探討了ChatGPT-4在將醫學術語翻譯成病人易懂語言的效果,並與不同醫師群體進行比較。研究評估了105個醫學術語,結果顯示ChatGPT-4的準確率達到100%,超過專科醫師(98.1%)、住院醫師(93.3%)和一般醫師(84.8%)。這些差異具有統計學意義,顯示ChatGPT-4在病人教育上是個可靠工具。不過,研究也強調醫療專業人員在臨床決策中的重要性仍不可或缺。 PubMed DOI

這項研究評估了ChatGPT 3.5和4.0在藥物諮詢服務中的表現。結果顯示,ChatGPT 3.5在80%的案例中提供了不錯的答案,而ChatGPT 4.0的表現更佳,98%的回應與醫生的回答相似或更好。不過,兩者的回應都缺乏參考文獻,有時也未能充分解決臨床相關問題。雖然ChatGPT 4.0的答案品質相當高,但在提供參考和臨床解釋方面的不足,顯示它不太適合成為臨床環境中的主要資訊來源。 PubMed DOI

這項研究強調藥物毒性評估對確保藥物安全性和有效性的重要性。研究比較了GPT-4和GPT-4o在預測分子毒性方面的表現,與傳統的深度學習和機器學習模型,如WeaveGNN等,特別針對骨骼、神經和生殖毒性。結果顯示,GPT-4在某些方面表現不相上下。 此外,研究還利用GPT-4結合分子對接技術,探討中藥材對心臟毒性的影響,發現黑芝麻、生薑和薑黃等成分對心臟靶點Cav1.2有顯著結合親和力,可能具心臟毒性。 總體而言,這項研究展示了ChatGPT在藥物化學中的潛力,並使開發高準確度模型變得更容易。 PubMed DOI

這項研究評估了ChatGPT-3.5在小兒腎臟移植教育上的潛力。研究人員向模型提出37個病患相關問題,模型的回答與健康專業人員相似。五位小兒腎臟科醫生根據準確性、相關性等指標評估這些回答,結果顯示準確性(4.51)、相關性(4.56)和全面性(4.55)都很高。雖然大部分回答評價良好,但有些被標示為潛在風險,顯示需要人類監督以確保安全與準確。 PubMed DOI

這項研究評估了OpenAI的ChatGPT-4在提供心房顫動相關資訊的準確性。研究使用108個結構化問題,涵蓋治療選擇和生活方式調整,由三位心臟科醫師根據準確性、清晰度和臨床相關性評估其回答。結果顯示,ChatGPT-4在「生活方式調整」和「日常生活與管理」表現良好,但在較複雜的問題上則表現不佳。整體而言,雖然它在簡單主題上有潛力,但對於需要深入臨床見解的複雜問題仍有局限。 PubMed DOI

這項研究發現,ChatGPT能夠針對罕見腎臟疾病提供大致正確且有同理心的資訊,特別是在預後和基因檢測方面表現不錯。不過,對於替代療法和第二意見的建議,回饋較為普通。整體來說,ChatGPT有助於病患教育與溝通,但仍需專業醫師把關,確保資訊安全無虞。 PubMed DOI

這項研究發現,ChatGPT(GPT-4o)能提出許多新穎又有創意的心臟毒性研究想法,例如用單細胞RNA定序、AI風險預測、機器學習分析心電圖等。雖然部分計畫太過理想化,但整體來說,AI有助於激發創新研究方向,未來有機會提升心臟毒性預測和照護品質。 PubMed DOI

這項德國研究發現,醫師和醫學生用ChatGPT查職業性肺病資料時,在找有害物質等研究任務上表現較好,也覺得自己專業知識有提升。但在臨床決策(像是否通報職業病)時,自己查資料的答對率反而更高。總結:ChatGPT適合輔助醫學研究,但臨床決策還是不能只靠它。 PubMed DOI