往期雜誌查閱
按總期數:第
按年份期數:
 首頁 > 原創熱文 > 正文
從ChatGPT觀機器人領域技術應用
文/王濤 [第3542期 2023-04-28發表]
 
作者介绍:
王涛,德國不來梅大學在讀博士,曾任藍胖子機器智能有限公司研發總監,英特爾中國研究院研究科學家,作為英特爾機械手項目負責人完成了Eagle Shoal 靈巧手及其操作平台的設計研發。其主要研究方向為基於多傳感信息融合的機器人操作,曾於ICRA等機器人頂會發表文章,曾獲得IROS 2017機器人抓取與操作大賽第三名,入選ICRA 2019服務機器人類別最佳論文Finalists。
 
ChatGPT近期引爆了AI領域並成功影響了全球的科技行業,隨着微軟的加持,各大科技巨頭的爭相入場,類ChatGPT技術的產業落地成為新的爆發點。
 
現在的ChatGPT早在2018年就出現了初代GPT模型,中間經歷了GPT-3的小火再逐步演化成現在的ChatGPT,其核心是AI(Artificial Intelligence)大模型中的大規模預訓練語言模型(Large Language Model),本質上屬於深度學習(Deep Learning)在NLP(Natural Language Processing)領域的技術突破。
 
早在2012年,深度學習在ImageNet競賽上大幅超越其他方法起,讓AI挑戰人類的各類賽事此起彼伏,各類突破人類極限的AI模型不斷出現。最具代表性的事件就包括AlphaGo打敗李世石。深度學習技術的突破是各個技術領域綜合能力爆發的結果,主要包含4個方向:
數據生產-消費級電子產品的普及以及高質量的圖像傳感器推動了數據生產。
數據採集-互聯網的普及,社交媒體的發展促使能夠通過網絡獲取大量數據。
基礎算力-GPU為代表的並行計算平台的算力突破提供了基本條件。
算法模型-網絡模型深度及復雜度的增加,新的技術方法的出現。
 
這些綜合的技術爆發為深度學習相關技術在學術界不斷突破之後,將技術紅利帶入機器人行業提供了基礎。過去10年間,深度學習在機器人行業引起的變革主要以視覺領域的應用落地為主。
 
在家庭場景中,掃地機器人發展已久,傳統的掃地機器人採用單線激光雷達,而隨着深度學習帶來的圖像處理能力的增強以及計算硬件成本的降低,更多的掃地機器人開始採用視覺模塊進行定位導航,包括推出相應的物體檢測和避障功能。視覺功能的引入讓掃地機器人使得機器人更加智能,具備更強的適應能力。
 
在工業場景下,深度學習的普及帶來了視覺物體檢測門檻的降低。相較於傳統物體檢測中設置規則以及模板匹配的方法,基於深度學習輸出的結果具有更強的適應性。特別針對於當前工業生產中小批量、多品種的趨勢,深度學習模型的泛化能力極大地降低了視覺檢測設備中的人工調試成本。
 
在物流行業中,高效的深度學習模型讓物流包裹的檢測分割變得更加準確,極高的檢測幀率使得設備對單件包裹的分揀速度能夠進一步提升,達到人工分揀的能力水平。結合條碼掃描設備中採用深度學習增強對模糊條碼識別能力,物流設備的運行效率和準確率可以進一步提高。這些技術點的突破促進了物流行業更全面高效的自動化推進。
 
上述各類場景中,深度學習帶來了RGB圖像和點雲數據的處理門檻的降低,也促進了RGBD相機的行業的廣泛應用,這些技術的相互促進,極大地推動了機器人技術的應用落地。
 
與之相較,ChatGPT當前在NLP領域所展現的突破性效果,已經引發了行業對搜索、客服、編輯等行業的變革,越來越多的工作開始借鑒這樣AI大模型產生的成果。相應的,作為未來技術方向之一的機器人領域,這樣的結合也會有諸多可能。
 
ChatGPT與機器人最直接的結合就是各類語音、教育、陪伴型機器人的應用,更加流暢自然的對話能夠讓這類機器人的實用性進一步提升,能夠成為最先應用的機器人產品領域。
 
ChatGPT超強的自然語言能力可以與編程結合,推動機器人行業低代碼的推廣,促進機器人行業門檻的進一步降低,進而實現機器人在各個領域進一步的廣泛應用,大幅提升各行業的機器人滲透率。
 
ChatGPT可以結合視覺檢測結果,實現機器人場景下的語義理解,通過理解自然語言的任務,實現各類複雜場景下的應用,為機器人在開放的非結構化場景中應用提供技術基礎。
 
類似深度學習在NLP領域應用ChatGPT所獲得的成功,這類AI大模型在其他領域的應用,可能使得機器人在抓取操作、運動控制等領域產生突破,成為未來通用型機器人的技術基石。


經導全媒體矩陣
海南瓊海
商聯通
經典時刻
總編輯話你知
識港--在這裏認識香港
《經濟導報》電子雜誌3544期
新時代新征程
經導系列雜誌-《中國海關統計》
《經濟導報》經典版面