原始文章

這項研究探討使用OpenAI的Whisper模型來檢測超鼻音,這是一種與軟顎咽部不足(VPI)相關的語音障礙,對心理社會和功能影響重大。傳統診斷方法需專業技術和設備,資源有限時難以取得。 研究人員調整Whisper模型進行二元分類,並在包含184個音頻錄音的數據集上訓練,結果顯示測試準確率達97%,F1分數為0.97,超越傳統機器學習方法。Whisper模型在各種錄音條件下表現優異,所需訓練數據量少,顯示其在超鼻音檢測中的可擴展性和效率,能有效優化臨床資源配置。 PubMed DOI


站上相關主題文章列表

研究發現 Whisper 的 ASR 系統在美式口音下表現較佳,對英式和澳洲口音識別較差,加拿大口音則類似。母語為英語者辨識率較高。研究也分析說話者特徵,如性別、母語和第二語言能力對錯誤率的影響。閱讀性語音表現較對話性好,並根據說話者性別調整。研究討論了這些結果的影響。 PubMed DOI

研究發現大型語言模型在耳鼻喉科疾病診斷中表現不錯,ChatGPT-3.5準確率最高達89%,建議仍需醫師監督。 PubMed DOI

這項研究探討大型語言模型(LLMs)在診斷下顎畸形的應用,目的是改善數據解釋,讓臨床醫師更容易使用。研究中將頭影測量數據轉換為文本,並分析多種LLM,如LLAMA-2和GPT模型,與傳統方法比較。結果顯示,較大的LLM在少量訓練下表現良好,減少分類模糊性,提升信息可及性和可解釋性。這些模型對經驗較少的醫師或資源有限的環境特別有幫助,未來隨著醫療數據集的改進,LLM的準確性和適用性將進一步提升。 PubMed DOI

這項研究探討了人工智慧模型,特別是ChatGPT和Perplexity AI,在評估聲音病理的有效性。研究比較了這些AI的聲音障礙評估與專家聽覺評估,分析了50名成人聲音障礙患者的資料。結果顯示,AI評估與專家評估之間並無顯著一致性(Cohen's Kappa, p = 0.429),而AI模型之間的診斷則有低度正相關(r_s = 0.30, p = 0.03)。總體來看,研究指出人工智慧可能不適合作為聲音護理團隊評估聲音障礙的工具。 PubMed DOI

大型語言模型(LLMs)在基礎牙科護理中展現潛力,特別是在診斷口腔疾病方面。評估顯示,這些模型在診斷顳顎關節障礙、牙周病、齲齒和錯牙合等病症上都有不錯的表現。特別是ChatGPT 3.5在中文中對牙髓炎的診斷能力從0%提升至61.7%,但對冠周炎的診斷能力下降。相比之下,ChatGPT 4.0在牙髓炎和冠周炎的診斷上都有顯著提升。總體來看,雖然LLMs在牙科護理中有潛力,但仍需進一步改進。 PubMed DOI

認知障礙是全球健康的重要議題,急需早期檢測與介入。傳統診斷方法主觀且成本高,資源不足地區更難取得。我們在INTERSPEECH 2024 TAUKADIAL挑戰中,針對169名英語和中文使用者,自動檢測輕度認知障礙(MCI)並預測認知分數。利用Whisper語音模型提取語音嵌入,並採用集成模型,我們在MCI分類中達到81.83%的召回率,認知分數預測則有1.196的均方根誤差,分別排名第二和第一。研究顯示,語言特有的細微差別對準確預測認知障礙至關重要,展現了在多語言環境中進行非侵入性評估的潛力。 PubMed DOI

基礎模型(FMs)是先進的AI神經網絡,能執行多種任務,如文本生成和影像分析。最近評估的Google Gemini 1.5 Pro是最大的多模態基礎模型,能準確解讀Google圖片和YouTube的喉鏡檢查影像。結果顯示,Gemini在98.9%的影像中準確識別喉鏡檢查,並在100%的視頻中表現優異。它在影像和視頻中也能診斷病理和識別病變,顯示出在耳鼻喉科的臨床決策支持上有很大潛力。這項研究被歸類為三級證據。 PubMed DOI

這項研究探討了OpenAI Whisper自動語音辨識(ASR)模型在轉錄幼兒自然語言的效果,特別針對有語言延遲和正常發展的幼兒。研究進行了34次互動,包含19名唐氏症兒童和15名正常發展兒童。結果顯示,ASR對正常發展兒童的單詞轉錄準確率為50%,但對唐氏症兒童僅14%。兩組的單詞遺漏率約20%,而單詞替換率差異明顯。ASR在捕捉非語音表達方面也有困難,特別是唐氏症組。雖然ASR有助於簡化轉錄,但其限制顯示需要人類監督,特別是對於被低估的族群。 PubMed DOI

睡眠呼吸障礙(SDB),特別是阻塞性睡眠呼吸暫停症(OSA),因氣道阻塞影響健康,及早介入非常重要。本研究利用機器學習(ML)和大型語言模型(LLM),透過電子健康紀錄(EHR)來識別SDB。提出的DSS-LLM框架結合動態海鷗搜尋演算法與LLM,使用臨床數據進行特徵提取和預處理,最終達到98.91%的分類準確率,顯示出其在臨床篩檢中的潛力,期望能改善耳鼻喉科的決策與病人結果。 PubMed DOI

這項研究探討大型語言模型(LLMs)在診斷燒灼口症候群(BMS)的準確性。研究使用了三個模型:ChatGPT-4o、Gemini Advanced 1.5 Pro和Claude 3.5 Sonnet,評估100個合成案例。結果顯示,ChatGPT和Claude的準確率達99%,而Gemini為89%。雖然準確率高,但模型在推理上有變異,偶爾會出錯,顯示臨床醫師監督的重要性。研究指出,LLMs可作為BMS的輔助診斷工具,但需專家驗證以確保有效性,對牙醫和專家皆有幫助。 PubMed DOI