丨趨勢丨下一代 AutoAI:算法的迭代變成數(shù)據(jù)的迭代
前言:
深度學習問世以來,隨著神經(jīng)網(wǎng)絡架構趨于固定和成熟,轉而尋找改進數(shù)據(jù)的方法,已經(jīng)成了AI 研發(fā)的新出口。
AutoAI自動執(zhí)行高度復雜的任務,為數(shù)據(jù)尋找并優(yōu)化最好的機器學習模型、特征和模型超參數(shù)。
作者 | 方文
圖片來源 | 網(wǎng) 絡
AutoAI在人工智能全生命周期中自動建模
AutoAI是最先進的自動化機器學習產品可以有效地分析歷史數(shù)據(jù),創(chuàng)建自定義機器學習管道并對其進行排名。
它包括自動化特征工程——可擴展和增強數(shù)據(jù)的特征空間以優(yōu)化模型性能。
AutoAI可以在幾分鐘內完成通常需要整個數(shù)據(jù)科學家團隊數(shù)個小時到數(shù)天才能完成的工作。自動化功能包括數(shù)據(jù)準備、模型開發(fā)、特征工程和超參數(shù)優(yōu)化。
整個建模過程端到端的自動化可以顯著節(jié)省資源。AutoAI顯著提高了生產力,只需點擊幾下鼠標,即使是只有基本數(shù)據(jù)科學技能的人,也可以使用自定義數(shù)據(jù)自動選擇、訓練并調優(yōu)高性能機器學習模型。
然而,專業(yè)的數(shù)據(jù)科學家可以快速迭代可能的模型和管道,并試驗最新的模型、特征工程技術和公平算法,無需從頭開始編寫管道代碼就可以完成這一切。
數(shù)據(jù)科學家的新語義能力
數(shù)據(jù)科學家理解了數(shù)據(jù)的語義,就有可能利用領域知識來擴展特征空間,從而提高模型準確性,這種擴展可以使用來自內部或外部數(shù)據(jù)源的補充數(shù)據(jù)來完成。
AutoAI檢測到正確的語義概念,程序就會使用這些概念廣泛搜索現(xiàn)有代碼、數(shù)據(jù)和文獻中可能存在的相關特征和特征工程操作。
AutoAI可以使用這些新的、語義豐富的特征來提高生成模型的準確性,并通過這些生成的特征提供可供人類閱讀的解釋。
即使沒有評估這些語義概念或者新功能的專業(yè)知識,數(shù)據(jù)科學家們還是可以試用AutoAI。但是,想要理解發(fā)現(xiàn)的語義概念并與之交互的數(shù)據(jù)科學家可以使用Semantic Feature Discovery(語義特征發(fā)現(xiàn))可視化資源管理器來探索發(fā)現(xiàn)的關系。
AutoAI 的三個階段
第一階段:模型設計、調參自動化
當前,很多學者都已經(jīng)注意到,學術界或者工業(yè)界的優(yōu)秀人才所聚焦的研發(fā),花費太多時間用于模型結構設計以及調參,但實際上它本不應該成為研究的主要內容。有沒有一種自動化的方法,讓深度學習的網(wǎng)絡架構在面對一個問題的時候,能自主的演化其架構,這才是關鍵。
第二階段:簡單模型訓練的軟件化
第一階段的自動化主要面向專業(yè)的算法研究人員,第二階段的系統(tǒng)化則面向一般的 AI 從業(yè)人員。主要目標是在給定標注好的數(shù)據(jù)的情況下,通過可視化的操作界面實現(xiàn)模型的訓練。
第三階段:數(shù)據(jù)迭代自動化
在算法設計自動化的基礎上,正在發(fā)生一些變化。模型和數(shù)據(jù)到底哪一個更重要 ,在設計化的工業(yè)生產中,以模型為中心的技術研發(fā)已經(jīng)轉化成以數(shù)據(jù)為中心的技術研發(fā)。
數(shù)據(jù)的迭代越來越重要
在工業(yè)化大規(guī)模發(fā)展中,大家正在慢慢地從模型為中心的生產轉化為以數(shù)據(jù)為中心。
可從兩個維度來提高它的性能,一是以模型為中心的方法,即想盡各種辦法提高模型設計的復雜度、技術含量等;
二是以數(shù)據(jù)為中心的方法,比如加數(shù)據(jù)(加數(shù)據(jù)也是有一些科學方法的,并不是加了數(shù)據(jù)后性能一定會提高)、檢查數(shù)據(jù)有沒有問題等等。
會發(fā)現(xiàn),以數(shù)據(jù)為中心的方法比以模型為中心的方法能更多地提高性能。
做模型生產時也得到這樣一個結論:越到后面,數(shù)據(jù)的迭代越來越重要。因為所有模型的服務實際上是針對某一個特定場景,使用的是特定的數(shù)據(jù)。
結尾:AutoAI未來適配率極高
如今,有自動化 AI 模型生產平臺需求的,已經(jīng)不僅僅是谷歌、微軟、Meta、IBM、蘋果等大公司了,我們國內就有不少房地產公司開始投入 AI。他們都有人才的需求,自動化的 AI 可以降低他們的成本。地產公司、物業(yè)公司,以及像寧德時代這樣做電池的公司,都在慢慢引入AI來解決實際問題。
AI是一個非;A的能力,可以提高我們做事情的效率,AI并不改變行業(yè),但是可以提升所在行業(yè)的生產效率,所以這種影響是全方位的,已經(jīng)慢慢地波及到非技術類公司了。
更不用說現(xiàn)在廣泛的制造業(yè),制造過程中的很多環(huán)節(jié)都可以利用到AI的能力。如果想提高自己的國際競爭力,提升自己的生產質量,就需要AI的能力去賦能生產。
部分內容來源于:雷鋒網(wǎng):下一代 AutoAI:從模型為中心,到數(shù)據(jù)為中心;至頂頭條:IBM的AutoAI讓數(shù)據(jù)科學家更高效,但可怕的是它正在變得太智能了;AI科技評論:下一代AutoAI:從模型為中心,到數(shù)據(jù)為中心
原文標題 : AI芯天下丨趨勢丨下一代 AutoAI:算法的迭代變成數(shù)據(jù)的迭代

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產業(yè)發(fā)展新路徑
- 3 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國產智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?