[發展與應用-38] 威利在那裡!4.5 秒找出畫中威利

《威利在哪裡?》這是一本從人山人海的場景中找出特定人物"威利"的兒童繪本。

「威利在那裡」機器人,在 4.5 秒內指出威利位置

首先,簡單介紹一下《威利在哪裡?》;這是一系列由英國插畫家 Martin Handford 創作的兒童繪本。

讀者唯一的任務就是從極其複雜、人多的像螞蟻的畫面中,依據威利的裝扮、長相,找出真正的威利在哪裡。

尋找威利要求讀者毅力、眼力兼具,許多讀者可能在找出威利的位置前,就氣餒地想先提早幫他辦理失蹤人口了。

但在機器人與 AI 的助力下,要從複雜的場景裡鎖定威利位置,再也不是件苦差事。

這台名為「威利在那裡」(There’s Waldo)機器人,由美國廣告公司 Redpepper 製作,擁有一隻由樹莓派電腦控制的機械手臂,並配備一個具有臉部辨識功能的鏡頭。

當機器人拍攝下《威利在哪裡?》的頁面圖畫後,會立刻運用電腦視覺庫 OpenCV 比對威利長相,再透過機器學習工具 Google AutoML Vision 分析,找出位置。

當機器人認為可信度超過 95% 時,便會指出圖畫中的威利位置,整個過程在5秒鐘內完成。

根據《The Verge》報導,負責該項目的技術人員 Matt Reed 透露,他利用 Google 圖片蒐集了 62 張威利大頭照,以及 45 張威利全身照,雖然這數量以機器學習的數據庫來說並不算多,但就結果而言,可相當準確地指出威利位置。

Reed 提到,開發這台機器人靈感,源自亞馬遜臉部辨識技術「Rekognition」的名人識別功能,於是想要打造一個用於卡通的版本,花了整整一週用 Python 編寫機器人程式。

Redpepper 在影片描述中表示,目前機器人僅須花費 4.45 秒,就能人山人海的繪畫中,指出真正的威利位置;人類要跟機器人在這方面競速,是贏不了的
(取自:機器人學習網)

留言

這個網誌中的熱門文章

人工智能將增強和破壞人性

從人工智慧、機器學習, 到深度學習,你不容錯過的人工智慧簡史

人工智慧的未來