Using cognitive psychology to understand GPT-3.
運用認知心理學理解 GPT-3。 Proc Natl Acad Sci U S A 2023-08-03

研究用認知心理學方法評估GPT-3，發現在某些任務表現不錯，但在因果推理和有向探索方面較弱。這些結果有助於我們更了解大型語言模型，也提出使用認知心理學工具深入研究高階人工智慧代理的建議。 PubMed DOI

Fighting reviewer fatigue or amplifying bias? Considerations and recommendations for use of ChatGPT and other Large Language Models in scholarly peer review.
在學術同儕審查中使用 ChatGPT 和其他大型語言模型時，如何避免審稿人疲勞或加劇偏見？考量與建議。 Res Sq 2023-07-12

使用大型語言模型如OpenAI的ChatGPT進行同儕評審可能提高效率，但也帶來挑戰。這種做法可能改變評審者和編輯的角色，提升評審品質，但也可能引發偏見和可靠性問題。建議在使用時透明並負責任地揭露，以應對不確定性和風險。 PubMed DOI

From human writing to artificial intelligence generated text: examining the prospects and potential threats of ChatGPT in academic writing.
從人類寫作到人工智慧生成文本：探討 ChatGPT 在學術寫作中的前景和潛在威脅。 Biol Sport 2023-04-21

這份研究探討了在學術寫作中使用像是ChatGPT這樣的先進人工智慧模型的好處和風險，強調了道德考量以及對真實性和可信度的潛在影響。儘管這些工具可以提升效率，但也引起了一些擔憂。研究建議進行全面討論和道德考量，主張人類智慧和批判性思維在學術工作中的重要性。 PubMed DOI

ChatGPT: a tool for scientific writing or a threat to integrity?
ChatGPT：科學寫作的工具還是對誠信的威脅？ Br J Radiol 2023-12-25

使用ChatGPT寫作需注意取代批判思考和學術技能的風險。儘管可輔助文字生成，不應取代人類創新責任。ChatGPT資訊或許不準確且有偏見，應謹慎使用。重視人類經驗在知識創造中的重要性，需嚴格審查以防止不準確內容。保持警覺並設定界限，維護科學研究品質和完整性。 PubMed DOI

A qualitative assessment of using ChatGPT as large language model for scientific workflow development.
使用 ChatGPT 作為大型語言模型進行科學工作流程開發的定性評估。 Gigascience 2024-06-19

科學工作流程系統受歡迎，但實施有挑戰。研究使用ChatGPT支援科學工作流程，發現模型擅長解釋，但修改或擴展表現不佳。需進一步研究改善此領域。 PubMed DOI

Assessing ChatGPT's ability to emulate human reviewers in scientific research: A descriptive and qualitative approach.
評估 ChatGPT 在科學研究中模擬人類評論者的能力：一種描述性和質性方法。 Comput Methods Programs Biomed 2024-07-02

這項研究評估了ChatGPT在評估科學文章時模仿人類評論者的能力。它分析了ChatGPT對20篇醫學研究文章的評論與人類評論者之間的一致性。結果顯示，ChatGPT與人類評論者的一致性程度不同，並且有限的能力完全複製人類的反饋。 PubMed DOI

Evaluating Literature Reviews Conducted by Humans Versus ChatGPT: Comparative Study.
人類與 ChatGPT 進行的文獻回顧評估：比較研究。 JMIR AI 2024-08-19

這項研究探討了ChatGPT-4在文獻回顧中的有效性，特別是在醫療法律背景下醫生與病人之間的關係。分析了由GPT-4生成的文獻回顧與人類研究者撰寫的回顧，並根據準確性、反應時間等標準進行比較。結果顯示，GPT-4在反應時間和知識廣度上表現優異，但在深入理解和情境相關性上較弱。研究強調，雖然GPT-4可作為初步工具，但仍需專家評估以提升學術成果的準確性和情境豐富性，特別是在醫學研究領域。 PubMed DOI

ChatGPT as Research Scientist: Probing GPT's capabilities as a Research Librarian, Research Ethicist, Data Generator, and Data Predictor.
ChatGPT 作為研究科學家：探討 GPT 作為研究圖書館員、研究倫理學家、數據生成器和數據預測者的能力。 Proc Natl Acad Sci U S A 2024-08-20

這項研究系統性評估了GPT-3.5和GPT-4在心理科學領域的四個關鍵能力。首先，作為研究圖書館員，GPT-4在生成虛構參考文獻的準確性上明顯優於GPT-3.5。其次，GPT-4在識別研究倫理問題方面表現出色，成功糾正了大部分明顯和微妙的違規。第三，兩者都能重現文化偏見，顯示出數據生成的潛力。最後，兩者在預測新數據方面的能力有限。總體來看，雖然GPT模型有所進步，但在生成新見解和可靠參考文獻上仍有待加強。 PubMed DOI

Editorial Commentary: The Scope of Medical Research Concerning ChatGPT Remains Limited by Lack of Originality and Leaves More Questions Than Answers.
編輯評論：關於 ChatGPT 的醫學研究範疇因缺乏原創性而受到限制，並留下更多問題而非答案。 Arthroscopy 2024-09-15

目前的研究主要探討ChatGPT在模擬病人詢問中的準確性，但對於其在醫療領域的廣泛應用卻缺乏深入研究。大多數研究重複相似實驗，限制了進展。要讓ChatGPT在醫療上發揮真正影響，需解決病人照護中的挑戰，如行政負擔和病人溝通等。建議建立一個結構化框架，包含問題識別、績效指標、跨領域合作、政策發展、財務支持及績效評估，以促進人工智慧的創新應用，改善醫療服務與病人結果。 PubMed DOI

Machine-assisted social psychology hypothesis generation.
機器輔助社會心理學假說生成。 Am Psychol 2024-09-16

這項研究探討大型自然語言模型如GPT-3和GPT-4如何幫助社會心理學研究者生成新假設。由於該領域發現眾多，整合想法變得困難，可能會錯過重要聯繫。研究採用兩種方法：首先對GPT-3進行微調，使用數千篇社會心理學摘要，專家評分後發現其生成的假設在清晰度和創新性上與人類相似；其次不微調使用GPT-4，結果顯示其生成的假設在多個維度上評分更高。總體來看，這些模型能有效支持假設生成。 PubMed DOI

原始文章

站上相關主題文章列表