搜尋結果

使用者輸入 使用 ai model 評讀 risk of bias (時間範圍: all)
轉換句 AI model for assessing risk of bias in research, how to use AI to evaluate bias risk in studies, machine learning models for bias risk assessment
執行時間 6.62404 秒
花費Token 131
Assessing the Risk of Bias in Randomized Clinical Trials With Large Language Models.
使用大型語言模型評估隨機臨床試驗的偏倚風險。 JAMA Netw Open / / 2024-05-22

這項研究探討使用大型語言模型(LLMs)來評估隨機臨床試驗(RCTs)中的偏見風險。兩個LLMs在30個RCTs上進行測試,顯示高正確評估率。LLM 2的準確度略高於LLM 1。這兩個模型在評估RCTs時表現出良好的一致性和效率,顯示它們在系統性回顧過程中具有潛力作為支援工具。 PubMed DOI

Integrating large language models in systematic reviews: a framework and case study using ROBINS-I for risk of bias assessment.
將此醫學文章的標題翻譯為繁體中文:「將大型語言模型整合到系統性評論中:以 ROBINS-I 進行偏倚風險評估的框架和案例研究。」 BMJ Evid Based Med / / 2024-02-21

研究評估了GPT-4語言模型在偏見評估上與人類審查者的一致性,提出了在系統性評論中運用此模型的框架。研究發現在某些偏見評估領域存在中等一致性。提出的框架包括系統性評論的理念、協議、執行和報告,並確定了評論的任務類型。雖然模型有潛力,但研究結果顯示仍需人類審查輸入。 PubMed DOI

An AI assistant to help review and improve causal reasoning in epidemiological documents.
一個用於檢視和改善流行病學文件中因果推理的人工智慧助手。 Glob Epidemiol / / 2024-01-09

介紹了一個名為人工智慧因果研究助理(AIA)的設計,旨在協助作者改善流行病學數據分析中的因果推論,以進行健康風險評估。AIA提供結構化的審查和建議,以增進科學論文中的因果推理。透過「因果人工智慧增強器」計畫,AIA引導大型語言模型(LLMs)系統性地審查手稿,並提供改進分析和報告的建議。其目標是透過作者和審查過程中的人工智慧協作,使因果分析方法更易被研究人員接受,並提高流行病學研究中因果推理的品質。 PubMed DOI

Assessing Risk of Bias Using ChatGPT-4 and Cochrane ROB2 Tool.
使用ChatGPT-4和Cochrane ROB2工具評估偏倚風險。 Med Sci Educ / / 2024-06-18

在醫學研究中,系統性回顧至關重要但耗時費力。ChatGPT-4和自動化改變了這情況,加快了過程並提高了可靠性。ChatGPT-4是智能助手,可快速評估研究中的偏見風險,改變了這領域,潛在挽救生命。雖需人類監督,但ChatGPT-4和自動化助力下,循證醫學前景光明。 PubMed DOI

Measuring the Impact of AI in the Diagnosis of Hospitalized Patients: A Randomized Clinical Vignette Survey Study.
衡量人工智慧在住院患者診斷中的影響:一項隨機臨床案例調查研究。 JAMA / / 2024-02-27

研究發現,AI模型對醫師診斷急性呼吸衰竭有影響。看標準AI模型醫師表現較好,但看偏見AI模型表現下降。即使有解釋,偏見AI模型也無法改善。標準AI提升準確性,偏見AI則降低。 PubMed DOI

Assessing the Decision-Making Capabilities of Artificial Intelligence Platforms as Institutional Review Board Members.
評估人工智慧平台作為機構審查委員會成員的決策能力。 J Empir Res Hum Res Ethics / / 2024-06-18

研究發現三個人工智慧平台可協助 IRB 起草 SOPs,提升審查效率。然而,仍需人類監督確保準確性。該研究測試了10個案例,顯示人工智慧在識別問題、提供指導和起草SOPs方面有潛力。 PubMed DOI

Leveraging artificial intelligence to detect ethical concerns in medical research: a case study.
運用人工智慧檢測醫學研究中的道德顧慮:案例研究。 J Med Ethics / / 2024-02-26

審查委員會(IRB)因為工作人員經驗不足,被批評批准研究計畫時出現延遲。研究指出,大型語言模型(LLMs)有助於提升IRB成員的審查效率。四個LLMs在案例研究中被測試,顯示在評估資格、易受傷害性、知情同意、風險效益分析和安慰劑使用等方面具有潛力。雖然LLMs在某些方面遇到困難,但在多次提示下有所改善。總的來說,LLMs有助於識別研究中的倫理關切並提高IRB的效率。 PubMed DOI

Benchmarking Human-AI Collaboration for Common Evidence Appraisal Tools.
人類與人工智慧合作的基準測試:針對常見證據評估工具。 J Clin Epidemiol / / 2024-09-14

這項研究探討大型語言模型(LLMs)在評估科學報告及臨床試驗方法學的有效性。研究比較了LLMs與人類評審的準確率,結果顯示人類的準確率高達89%至75%,而LLMs的準確率則較低,PRISMA介於63%到70%之間。雖然結合LLM的評分能提升準確率,但仍不及人類。研究指出,人類與AI合作能提高效率,特別是在較簡單的任務上,但對於複雜的評估則效果有限。 PubMed DOI

Using artificial intelligence to semi-automate trustworthiness assessment of randomized controlled trials: A case study.
使用人工智慧半自動化隨機對照試驗的可信度評估:案例研究。 J Clin Epidemiol / / 2025-01-19

隨機對照試驗(RCTs)對循證醫學非常重要,但有些試驗使用虛構數據,影響研究的完整性。本研究探討利用GPT-4驅動的ChatGPT來簡化RCT評估過程。透過TRACT檢查表,ChatGPT能有效處理RCT論文的PDF,並準確回答檢查項目,與人類評估者的一致性達84%。此外,ChatGPT在數據提取方面也表現出色,對三個表格達到100%準確率。未來將致力於提升ChatGPT在多個RCT中的應用,實現更高的數據捕捉準確性及自動化處理。 PubMed DOI

Beyond the Hype-The Actual Role and Risks of AI in Today's Medical Practice: Comparative-Approach Study.
AI在當今醫學實踐中的實際角色和風險:比較方法研究。 JMIR AI / / 2024-06-14

AI在醫療保健領域發揮重要作用,像ChatGPT-4和Microsoft Bing展現出強大的文字生成和搜索能力。研究探討AI是否能獨立寫學術論文,著重於內容相關性、準確性、清晰度和語氣。ChatGPT-4表現出更深入見解和準確引用,而Microsoft Bing提供簡潔概述。結合兩者或許能增進學術支持,但研究者需批判性評估AI輸出以維護學術誠信。 PubMed DOI

Zero- and few-shot prompting of generative large language models provides weak assessment of risk of bias in clinical trials.
生成大型語言模型的零-shot和少量提示對臨床試驗中的偏見風險評估提供了薄弱的依據。 Res Synth Methods / / 2024-08-23

這項研究探討了使用生成性大型語言模型(LLMs)來自動化醫學研究中的偏見風險評估(RoB)。研究發現,LLMs在新整理的測試數據集上的表現不如預期,F1分數僅在0.1到0.2之間,與簡單基準相似,顯示其在RoB2預測任務中的效能有限。即使在分解任務中,表現也不佳,遠低於傳統監督系統。這顯示目前的LLMs尚不適合作為RoB2評估的可靠工具。 PubMed DOI

The Sociodemographic Biases in Machine Learning Algorithms: A Biomedical Informatics Perspective.
機器學習演算法中的社會人口統計偏見:生物醫學資訊學觀點。 Life (Basel) / / 2024-06-27

機器學習在醫療決策中的風險評估中可能存在偏見,導致不公平。解決方法包括使用去偏見技術來減輕這些偏見,確保公平的醫療風險評估和決策。 PubMed DOI

Gender Bias in AI's Perception of Cardiovascular Risk.
AI 對心血管風險的性別偏見。 J Med Internet Res / / 2024-10-22

這項研究探討了GPT-4在評估冠狀動脈疾病風險時可能存在的性別偏見,使用了相同的臨床情境來比較男性和女性,其中一些人有精神疾病的共病情況。研究結果顯示,精神疾病的存在可能會影響GPT-4對男性和女性冠狀動脈疾病風險的評估方式。 PubMed DOI

Language models for data extraction and risk of bias assessment in complementary medicine.
補充醫學中數據提取和偏倚風險評估的語言模型。 NPJ Digit Med / / 2025-01-31

這項研究評估大型語言模型(LLMs)在107項補充醫學試驗中的數據提取及偏見風險評估的效果。僅用LLM的方法,如Moonshot-v1-128k和Claude-3.5-sonnet,準確率達95%以上;而LLM輔助的方法更佳,準確率可達97%以上。此外,LLM輔助的方法處理時間大幅縮短,分別只需14.7分鐘和5.9分鐘,傳統方法則需86.9分鐘和10.4分鐘。這些結果顯示,LLM結合人類專業知識能有效提升證據綜合的效率與準確性。 PubMed DOI

Bias of AI-generated content: an examination of news produced by large language models.
人工智慧生成內容的偏見:對大型語言模型生成的新聞進行檢驗。 Sci Rep / / 2024-03-07

LLMs透過AIGC改變生活,但需了解其限制。研究發現ChatGPT等LLM生成的內容存在性別、種族偏見,歧視女性、黑人。ChatGPT偏見最少,且能拒絕有偏見提示。 PubMed DOI

Artificial intelligence generated clinical score sheets: looking at the two faces of Janus.
人工智慧生成的臨床評分表:看珠諾斯的兩面。 Lab Anim Res / / 2024-05-15

在動物實驗中,使用臨床評分表評估痛苦程度。人工智慧在臨床前研究中愈來愈常見,包括製作動物福利評估表。一研究比較三種大型語言模型在創建評分表的表現。雖然模型能有效輸出,但在症狀值分配和閾值定義上有差異。專業審查對確保AI工具在研究中精確可靠至關重要。 PubMed DOI

Influence of believed AI involvement on the perception of digital medical advice.
相信 AI 參與對數位醫療建議感知的影響。 Nat Med / / 2024-07-25

這項研究顯示,AI生成的醫療建議相比人類醫師的建議,存在明顯的偏見。在兩項研究中,2,280名參與者對不同來源的醫療建議進行評估,結果發現標示為AI或人類與AI結合的建議,被認為不如人類醫師的建議可靠且缺乏同理心。參與者對有AI參與的建議表現出較低的遵循意願,顯示出數位醫療建議中普遍存在反AI的偏見。這強調了未來研究需要探索減輕這種偏見的策略,以發揮AI在醫學領域的潛力。 PubMed DOI

Assessing prognosis in depression: comparing perspectives of AI models, mental health professionals and the general public.
評估憂鬱症預後:比較人工智慧模型、心理健康專業人士和一般大眾的觀點。 Fam Med Community Health / / 2024-01-30

研究探討AI如何幫助評估憂鬱症預後,並與人類看法比較。比較了不同AI模型和心理專業人員在預測患者結果的表現。結果顯示,大多數情況下AI和專業人員看法一致,但有一模型較悲觀。研究指出AI可補充專業人員,但需整合人類判斷。 PubMed DOI

Better informing everyday fall risk assessment: experimental studies with contemporary technologies.
提升日常跌倒風險評估的資訊:應用當代科技的實驗研究。 Lancet / / 2024-03-08

研究探討了年長者行動問題和脆弱導致墜倒風險增加的議題,提出利用人工智慧和視訊眼鏡評估墜倒風險的新方法,考慮環境因素。兩個案例研究顯示了準確辨識墜倒風險危害的潛力。這項AI方法旨在改善墜倒風險評估,同時保護隱私,可能對提升整體健康和生活品質有顯著影響,尤其對長者而言。下一步是在實際環境中應用AI,擴大參與者範圍。研究得到NIHR ARC東北部和北坎布里亞以及諾桑比亞大學工程與環境學院的支持。 PubMed DOI

Future Perspective of Risk Prediction in Aesthetic Surgery: Is Artificial Intelligence Reliable?
美容外科風險預測的未來展望:人工智慧可靠嗎? Aesthet Surg J / / 2024-06-28

人工智慧在醫學領域扮演關鍵角色,尤其在美容外科手術知情同意書的準確性和清晰度方面。研究發現,ChatGPT-4生成的材料受外科醫師青睞,因為其準確性和醫學信息。遵循ASPS建議簽署特定手術和一般知情同意書可預防併發症,確保患者清楚了解手術內容。 PubMed DOI