講題: 生成式AI在視訊分析應用與展望
演講者: 葉家宏教授/國立臺灣師範大學電機工程學系
時間:113年11月14日(四)14:00~16:00
地點:理工二館1樓第三講堂 (C101)
演講摘要:生成式AI在多模態視訊理解領域展現出革命性的潛力。視覺轉換器(ViT)提升視訊中影像內容的處理能力,文字轉向量技術(Word2Vec, GloVe)則為文字的語意理解奠定了基礎。隨這些技術相互結合,使影像和文字之間的連結研究快速發展。
過去視訊摘要僅能透過影像的低階特徵學習預測出重要的視訊片段,然而透過生成式AI的視訊摘要能夠依照使用者的文字,生成精簡且符合用戶需求的視訊內容,使視訊摘要更為精確和易於理解。同時,生成式AI的進步也使視訊定位技術得到突破性發展。
在過去視訊定位需依賴影像搜尋,造成結果較為零星和不連續,如今只需利用文字描述就能找出特定物體或行為事件在視訊中的出現時間片段,實現高效的事件檢索。隨著演算法的不斷進步,生成式AI已廣泛應用於遊戲決策分析、多媒體影音製作、智慧教學等領域,
對我們的生活和工作方式產生深遠影響。