原始文章

這篇論文探討如何將領域專業知識融入提示工程,以提升大型語言模型(LLMs)在科學領域的表現。研究顯示,這種新方法在能力、準確性、F1分數及減少幻覺等指標上,表現優於傳統方法。針對MacMillan催化劑、紫杉醇和鋰鈷氧化物等複雜材料的案例研究,證實了這種方法的有效性。結果顯示,專業提示能幫助LLMs產生更準確的輸出,顯示其在科學研究中的潛在價值。論文也討論了目前方法的限制及未來研究方向。 PubMed DOI


站上相關主題文章列表

研究發現大型語言模型對化學有潛力,透過提示解決問題,表現不錯。最新模型在寫化學程式碼方面表現高準確。透過提示工程策略,可進一步提升準確性。研究使用的數據集和評估工具是開源的,有助未來研究。這些模型的成功可能對化學教育和研究有重大影響。 PubMed DOI

像GPT-4這樣的大型語言模型因其在化學和材料科學中的應用潛力而受到關注。最近的一次黑客松展示了利用這些模型的各種項目,從預測分子性質到開發教育工具。這次活動突顯了LLM對科學領域的廣泛影響,不僅僅是在化學和材料科學領域。 PubMed DOI

ChatExtract 方法提出了一種簡單有效的方式,利用對話式大型語言模型(LLMs)自動從研究論文中提取數據。透過設計好的提示應用於LLM,ChatExtract 能夠確保數據正確性,同時透過後續問題來辨識和提取數據。測試結果顯示,與GPT-4等對話式LLMs相比,ChatExtract 的精確度和召回率接近90%。這種方法利用了對話模型中的信息保留、冗餘性和引入不確定性,以提高準確性。ChatExtract 在各個領域中進行數據提取有著巨大的潛力,就像在建立金屬玻璃和高熵合金數據庫時所展示的那樣。 PubMed DOI

大型語言模型如ChatGPT在放射學領域有潛力,但成效需靠即時工程處理。不同提示策略可客製化模型回應,無需額外訓練。少樣本學習和嵌入式技術對提升聊天機器人輸出和透明度至關重要。在放射學等專業任務中,提示工程對LLMs利用至關重要,隨模型演進,零樣本學習等方法愈見重要。 PubMed DOI

GPT-4和Claude等大型語言模型正改變醫學研究,包括風濕病學。評論指出,及時的工程指導對引導這些模型很重要。使用大型語言模型可加速工作,但要注意準確性。研究人員需精心製作提示並評估模型輸出以增強相關性和實用性,同時使用本地運行的開源模型保護數據隱私。了解模型限制和掌握戰略提示對於大型語言模型在風濕病學研究中的應用至關重要。 PubMed DOI

大型語言模型(LLMs)在各種任務上表現出色,但在化學領域卻遇到困難。ChemCrow是一個LLM化學智能助手,整合了專業工具和GPT-4,以增強有機合成和藥物發現等化學任務。ChemCrow能夠自主規劃合成路線並有效地引導發現,將實驗和計算化學有效地連結,促進科學進步。 PubMed DOI

預先訓練並微調的大型語言模型(LLMs)在預測無機化合物的合成可行性和選擇無機合成的前驅物方面非常有效。相較於專門的機器學習模型,微調後的LLMs表現優異,使用者需要的專業知識、成本和時間也較少。這種方法將成為未來化學機器學習研究的重要參考,同時也是實驗化學家的實用工具。 PubMed DOI

最近,人工智慧和自動化的進展正在徹底改變催化劑的發現與設計,從傳統的試錯方法轉向更高效的高通量數位方法。這一變化主要受到高通量信息提取、自動化實驗、實時反饋和可解釋機器學習的驅動,促成了自駕實驗室的誕生,加速了材料研究的進程。近兩年,大型語言模型的興起也為這個領域帶來了更大的靈活性,改變了催化劑設計的方式,標誌著學科的革命性轉變。 PubMed DOI

小分子的設計對於藥物發現和能源儲存等技術應用非常重要。隨著合成化學的發展,科學界開始利用數據驅動和機器學習方法來探索設計空間。雖然生成式機器學習在分子設計上有潛力,但訓練過程複雜,且生成有效分子不易。研究顯示,預訓練的大型語言模型(LLMs)如Claude 3 Opus能根據自然語言指示創建和修改分子,達到97%的有效生成率。這些發現顯示LLMs在分子設計上具備強大潛力。 PubMed DOI

這篇論文提出了一個評估大型語言模型(LLMs)在生物醫學知識編碼的框架,特別針對抗生素研究。框架分為三個步驟:流暢性、提示對齊和語義一致性,並評估事實知識和回應的具體性。研究涵蓋了ChatGPT、GPT-4和Llama 2等十一個模型,透過生成化合物定義和確定化合物與真菌關係的任務進行評估。結果顯示,雖然流暢性有所提升,但事實準確性仍有待加強,對LLMs作為生物醫學知識庫的可靠性提出了疑慮,並強調需要更系統的評估方法。 PubMed DOI