原始文章

2024年語音人工智慧研討會將於5月1日至2日在佛羅里達州坦帕舉行,由Bridge2AI-Voice Consortium主辦。活動設有四個互動小組討論,旨在提升參與感與深入交流。每個小組討論將有45分鐘的專家提問,接著是45分鐘的「利害關係人論壇」,讓觀眾提問並進行互動投票,促進有意義的對話。研討會內容會進行音頻錄製,並利用生成式人工智慧工具製作文字稿,經過作者審核與編輯。 PubMed DOI


站上相關主題文章列表

這份報告探討了基於音頻數據訓練的人工智慧(AI)模型在提升臨床任務和醫療決策的潛力,特別是在資源有限的環境中。目前技術主要依賴高收入國家的數據,這對廣泛應用造成挑戰。報告介紹了一個新應用程式HEAR,透過音頻問題收集健康資訊,創造「語音電子健康紀錄(Voice EHR)」。初步實驗顯示,這種方法收集的數據與傳統方式相比,相關性相當甚至更高,能捕捉複雜的健康生物標記,可能解決標準臨床數據集的限制。 PubMed DOI

為了提升住院病人的睡眠品質,我們開發了一個對話式代理,能有效收集和分析睡眠數據。這個系統使用Richards-Campbell睡眠問卷,並加入環境因素的問題,如房間溫度和照明,全面評估睡眠干擾。透過病人的口頭回應,代理能識別影響睡眠的環境和護理因素,並提供非藥物介入方案。結合先進的人工智慧技術,這個系統簡化了睡眠評估,支持以病人為中心的醫療,展現提升睡眠品質管理的潛力。 PubMed DOI

語言和言語障礙對溝通能力造成挑戰,影響學業和社交。ChatGPT等AI工具在協助這些障礙者方面展現潛力,透過增強和替代溝通技術及言語治療應用程式,能有效支持他們的需求。未來需持續研究,確保這些AI工具在臨床上可負擔且可及,以改善言語和語言障礙者的溝通能力。 PubMed DOI

這項研究發現,AI聊天機器人產生的科學白話摘要比人類寫的更容易懂,對教育程度較低的人特別有幫助,品質也差不多。研究人員,尤其是非英語母語者,可以用AI來寫PLS,但還是要記得檢查內容有沒有錯。 PubMed DOI

這篇論文介紹一套語音超市助理系統,評比四種語音辨識工具,發現 OpenAI 的 Whisper 準確度最高。團隊還開發多LLM聊天機器人架構,使用體驗比單一GPT-4 Turbo更好,能把回應連結到貨架位置,方便機器人導航。結果顯示,結合多個專業模型比只用一個大型模型更有效。 PubMed DOI

這項研究比較六種AI語言模型設計5歲兒童語言治療計畫的表現,發現AI產出的計畫品質從「需要改進」到「符合預期」都有。使用更結構化的提示能提升結果,但提供更多個案細節未必有幫助。每種AI工具各有優缺點,這些發現可作為語言治療師和教育人員負責任使用AI的參考。 PubMed DOI

這項研究發現,AI聊天機器人在醫療互動相關回顧的表現和人類一樣準確,內容更完整、脈絡解釋也更好,但回答較長。人類則較少加入新內容。ZenoChat表現最佳,顯示大型語言模型能有效協助質性研究,加快整理證據的速度。 PubMed DOI

這項研究發現,利用 ChatGPT 進行現象學分析,不僅能處理大量質性資料,還能維持分析深度。透過自訂提示詞,AI 能有效整理與詮釋人類經驗,展現成為意識研究輔助工具的潛力。不過,方法還需優化,才能更精確掌握細微差異。 PubMed DOI

這項研究提出 ABCD 系統,利用兩個 AI(AI 臨床醫師和 AI 失語症患者)自動模擬語言治療對話,省時又省錢,不需真人參與。系統用 GPT-4o 和語音工具打造,zero-shot 提示效果最好。ABCD 有助於開發和測試失語症治療 AI,突破臨床研究瓶頸,未來應用潛力大。 PubMed DOI

VOICE 是一套結合大型語言模型和互動視覺化的科學溝通工具,能用語音指令即時操作 3D 模型並獲得解說。它採雙層代理架構、微調和提示工程,並以分子視覺化為例,經用戶研究證實能有效滿足需求。更多資訊可見 https://osf.io/g7fbr。 PubMed DOI