CVlab研究室的專任研究助理蔡其翰(左)與成大數據所一年級李家銘同學(右),獲IEEE ICASSP 3rd COV19D Competition世界冠軍。
國立成功大學數據所助理教授許志仲長期專研影像辨識與分析,從自駕車的視覺決策系統、生醫影像分析、偽造影像辨識與社群媒體資料預測等皆有涉略,成立成功大學數據所ACVlab,3年來帶領團隊參與相關國際競賽,獲獎無數,今年指導學生參賽,獲IEEE ICCV 2023評審特別獎、ICME全球季軍,與連續第二年的IEEE ICASSP 3rd COV19D Competition世界冠軍,鼓勵成大學生透過國際競賽被世界看見。
圖說:IEEE Signal Processing Society (IEEE 信號處理學會)舉辦的 IEEE ICCV 2023(International Conference on Computer Vision 2023,國際電腦視覺研討會)競賽任務中,學生必須透過系統,預測出球員和球的位置。
成大數據所一年級吳明軒、李家銘獲IEEE ICCV 2023評審特別獎,他們表示,今年9月遠赴巴黎參加IEEE Signal Processing Society (IEEE 信號處理學會)舉辦的 IEEE ICCV 2023(International Conference on Computer Vision 2023,國際電腦視覺研討會)競賽,過程中必須在有限的訓練資料下,發展出具穩定效能的系統,他們的任務必須透過系統,預測出球員和球的位置,於是透過分析籃球場的邊界和球員內部的特色屬性,將其資料做轉換,根據少數的資料、已知的訊息,對資料去擴展為大運算資料,逐一完成相關的影像判讀任務,並因只需要比較少的計算資源,減少人力跟計算成本,就可以取得極佳的判讀效果,跳脫基本框架的思維,讓他們從全球178參賽隊伍中脫穎而出。
許志仲說明,IEEE ICCV是全球電腦視覺領域最頂尖研討會,與會者近年來都超過7千人,因此要在全球相關領域的好手中獲得佳績相對來講更為困難。這項競賽不允許預先訓練模型,換句話說只能在其提供的超少量資料上進行訓練,以往會運用2000*3000以上的影像進行推算、提升效能,但這與主辦預期的少量資料與少量GPU使用情境不同,於是團隊成員們花了非常多的時間投入競賽中,提出所謂記憶存取的高效能方法,僅需要一個係顯示卡便可進行訓練,打破大模型,大量GPU,才能有良好的效果的研究方法的迷思,具學術價值與創意的解決方法,除了最終排名Top 3%的好成績,更獲得評審青睞,拿下唯一的評審特別獎。
成大數據所三年級的蔣允中與成大數據所一年級曾文海、成大數據所二年級學生黃韋皓,六月參加「ICME2023 Grand Challenge – Low-power Deep Learning Object Detection and Semantic Segmentation Multitask Model Compression Competition for Traffic Scene in Asian Countries」國際競賽,獲得全球第三。
圖說:ICME競賽需開發一個通用的模型同時完成語意分割模型與物件偵測兩大經典任務。
蔣允中同學進一步解釋,ICME (IEEE International Conference on Multimedia & Expo, 國際多媒體會議與博覽會)是多媒體領域的頂尖研討會,今年共有223隊參加,此競賽由聯發科技所贊助,目標是在亞洲城市等具有很多摩托車的地方,開發一個通用的模型同時完成語意分割模型與物件偵測兩大經典任務,並且僅能在移動式低功耗的平台上進行運作,因此非常講究實作能力,每個任務都有不同的資料集,與其需要辨讀出的道路影像,必須使用一個網路架構解出不同的任務,但是來自不同資料庫的資訊,有多種不同的標註資料,像是機車、汽車、小貨車、大卡車等,要如何分辨是比較難突破的部分,最後他們努力完成目標,透過同一個網路讓影像進行平均判讀,也分別在223隊中獲得全球第二的佳績進入決賽,最終拿到第三名。
IEEE ICASSP (International Conference on Acoustics, Speech, & Signal Processing,國際聲學、語言學與訊號處理研討會) 是IEEE Signal Processing Society 一年一度舉辦的訊號處理領域之旗艦研討會,領域涵括各式各樣的訊號處理議題,包含語音、文字探勘、影像視訊等都涵括在內,每年吸引了許多國際知名領域研究者投稿與與會。
ACVlab研究室的專任研究助理蔡其翰,擅長分析資料判讀的主因,今年5月連續第二年參加新冠肺炎辨識競賽,(COVID-19 Detection Challenge),透過找出 AI 模型學習的關鍵,改變模型的架構,將原本CT影像中無關重要的區域自動移除,產出更好檢測畫面,最後經由統計專業分析 500 多組資料,在上千張的 CT 中找到正確的肺部切片,辨別準確率近9成,拿到世界第一,這也是該團隊連續第二年奪冠。
「每個人進來都能在畢業前拿一個獎。」許志仲表示,學校最重要的是培育人才,相較資工、電機等科系,如何讓學生脫穎而出,成為不輸給任何學科的人才,讓學習統計學的學生,有效地將跨領域的學習成果呈現出來,一直是系上所重視的一環;然而,除了在校表現,更希望能讓成大的學生被世界認證,於是比起國內競賽,他更時常鼓勵學生出國比賽,除檢視自己熟悉的科學數據分析能力,國外競賽的影像資訊判讀融合醫學、運動、物理、外語能力等不同的跨域能力,更是一大挑戰。
許志仲表示,學生們兼顧學業之餘參加國際競賽,能有這麼多優異的表現相當難得,如何指導學生,除了協助拿捏時程、進度,最重要的莫過於溝通,多多傾聽學生們的困難,只要同學們展現一定的企圖心、自動自發去做就一定會有好成績,未來盼能傳承相關研究與參賽經驗,鼓勵更多學生參與國際競賽、讓成大學生的優秀表現被國際看到。
圖說:國立成功大學數據所ACVlab團隊3年來參與相關國際競賽,成績斐然,前排中為助理教授許志仲。