訂閱
糾錯
加入自媒體

小米開發(fā)者大會關鍵詞盤點:相機影像、小愛同學和AIoT

雷軍:2021年將擴招5000名工程師,聚焦10大領域。

11月5日,小米開發(fā)者大會正式召開。

大會上,雷軍立下工程師擴增5000人新目標,并帶來了小愛同學5.0版本等6大最新技術成果,以及一個“重磅發(fā)布”。

“相機影像技術”貫穿全場,伸縮式大光圈鏡頭創(chuàng)新亮相

在上午的小米開發(fā)者大會中,如果問哪個部分最常被提及的話,那或許就是相機影像技術了。

2016年4月,小米在手機業(yè)務成立核心器件部,下設相機組;

2018年,“相機組”單獨成立一級部門“相機部”。

時至今日,小米相機部的團隊已經(jīng)從122人擴增至850人,另外還有350名AI工程師,并在北京、東京、巴黎等9地設立研發(fā)中心,邀請超過40位全球行業(yè)泰斗加盟,以打造世界頂級影像表現(xiàn)。

小米開發(fā)者大會三大關鍵詞:相機影像、小愛同學和AIoT

從目前的成果來看,小米在相機影像技術方面可以說是成功的,諸如在太空拍地球等諸多創(chuàng)新嘗試令消費者驚嘆。

在之后小米集團副總裁、集團技術委員會主席崔寶秋演講中,“相機影像能力”也成為重點分享內(nèi)容:120倍潛望式長焦、128°超廣角、長焦微距、一億像素……

而就在今天下午的演講部分,小米也不負眾望的帶來了最新的相機創(chuàng)新技術——伸縮式大光圈鏡頭。基于這一技術,手機似乎在形態(tài)上正趨向于相機。

小米開發(fā)者大會三大關鍵詞:相機影像、小愛同學和AIoT

依據(jù)小米副總裁、手機部總裁曾學忠的介紹,該技術借鑒專業(yè)相機,自主開發(fā)伸縮相機技術,可在有限的尺寸下,達到更好的光學效果。

具體數(shù)據(jù)方面,超大光圈進光量提升300%,引入全新防抖技術,畫面更穩(wěn)定,清晰度提升20%。目前該技術已實現(xiàn)了小型化,可做到手機中。

在介紹的最后,曾學忠也表示,在不久的將來,這一技術將會與用戶見面。

小愛同學5.0、開放相機三大功能……小米發(fā)布6項技術

作為一個智能語音助手,在小米智能生態(tài)中,小愛同學作為“入口守護者”的重要性不言而喻。

小米集團副總裁、技術委員會主席崔寶秋在現(xiàn)場表示,小愛同學截至目前累計喚醒次數(shù)已達617億次,可能是中國最活躍的AI語音交互平臺;激活小愛同學的設備數(shù)達到2.28億臺;小愛同學月活躍用戶達到7840萬。

而在此次現(xiàn)場,崔寶秋也正式揭開了小愛同學5.0版本的神秘面紗,以及與此相關的產(chǎn)品升級。

小愛同學5.0

全場景智能協(xié)同:協(xié)同喚醒——多設備環(huán)境下智能選用最佳方式應答傾聽;協(xié)同響應——多設備環(huán)境下智能調(diào)度最優(yōu)設備響應執(zhí)行;協(xié)同提醒——多設備環(huán)境下自動生成個性化設備聯(lián)動建議;

對話式主動智能;

定制化情感聲音:兒童音色泡芙;定制聲音終端上線;更地道的粵語;

多模態(tài)融合交互:小愛同學音箱端支持手勢控制、童臉識別、距離檢測;小愛同學手機端支持多模態(tài)輸入掃描、識物、翻譯、掃文檔等;

智慧學習好助手:AI課程表——支持1000所高校、拍攝導入、全終端通用;AI翻譯——面對面翻譯、連續(xù)翻譯、一句話翻譯;K12教輔——精選優(yōu)質(zhì)視頻網(wǎng)課,教育會員三端共享;知識問答——十萬個為什么,世界之最。

據(jù)悉,目前使用小米智能設備的用戶已超3600萬,設置智能互聯(lián)場景的用戶達900萬,每天使用智能掃地機器人的家庭超過400萬,小米的智能門鎖守護了超過200萬個家庭的安全。

“小米的技術已經(jīng)滲透到了人們生活的方方面面,而小愛同學5.0正是大家的智能生活助手!贝迣毲镌诂F(xiàn)場表示。

小米開發(fā)者大會三大關鍵詞:相機影像、小愛同學和AIoT

· MiNLP 3.0 &下一代語音識別工具

去年的開發(fā)者大會上,小米發(fā)布了MiNLP 2.0版本,今年則帶來全新的3.0版本,具體的升級主要體現(xiàn)在:

升級至四大功能板塊——在基礎算法、語義理解上,新增內(nèi)容理解、輿情分析模塊

提升語義解析技術——結(jié)合預訓練、知識圖譜能力,全面提升深層語義解析技術

拓展多模態(tài)理解能力——基于文本、語音、圖像和視頻等多模態(tài)特征,對內(nèi)容精準理解

與此同時,崔寶秋也表示,開源一定是未來的方向。這之后,他對外公布了MiNLP開源計劃。

依據(jù)計劃,小米的第一步是在2020年11月中下旬正式對外開源MiNLP-分詞,2021年Q1開放MiNLP-詞性標注,2021年Q2開放MiNLP-命名實體識別,2021年Q3對外開放MiNLP-語義相關功能。

小米開發(fā)者大會三大關鍵詞:相機影像、小愛同學和AIoT

值得注意的是,MiNLP 3.0和開源計劃并不是小米在智能語音語義技術方面的全部實力。

崔寶秋在現(xiàn)場說到,“去年Daniel Povey加入了小米,擔任小米集團語音首席科學家,他在加入時就說要打造下一代Kaldi!本驮诂F(xiàn)場,Povey也被邀請上臺,介紹了下一代Kaldi的相關情況。

Povey介紹,在下一代Kaldi中,“K2”語音識別庫將是最核心的部分,它可以消除過往語音識別算法中的一些代碼不匹配問題,并且速度更快、通用性更強,可以用來建模多種語音識別算法。

· 移動端深度學習框架MACE 1.0&物聯(lián)網(wǎng)軟件平臺Xiaomi Vela

MACE全稱為Mobile AI Compute Engine,是一個移動端的深度學習框架,第一次出現(xiàn)在小米發(fā)布會是在2018年,直到2019年才推出0.12版本。彼時,MACE針對移動芯片特性進行了大量優(yōu)化,在小米手機上的人像模式、場景識別功能中已廣泛應用。

今天的開發(fā)者大會上,MACE升級到了1.0版本——MACE Micro,這是小米單獨為小規(guī)模IoT產(chǎn)品打造的引擎。依據(jù)崔寶秋的介紹,MACE Micro的代碼量低至數(shù)百KB,傳感器和處理器功耗均小于1毫瓦,成本低至0.1美元,將致力于助力AI全線賦能AIoT產(chǎn)品。

眾所周知,AIoT已經(jīng)成為了小米生態(tài)戰(zhàn)略的一部分,而除了AI計算引擎,小米也帶來了物聯(lián)網(wǎng)軟件平臺“Xiaomi Vela”,該平臺基于開源的NuttX系統(tǒng)打造而成。

基于過往的成果,以及此次發(fā)布的計算引擎和專用平臺,就“賦能AIoT”這條道路上,可以看到在走得更遠的同時,小米也沒有忘記夯實“地基”。

· 開放相機三大能力

崔寶秋在現(xiàn)場表示,小米有信心讓自己的相機團隊繼續(xù)保持世界第一,這一自信的背后是小米對于技術的執(zhí)著投入。當前,小米已經(jīng)在全球范圍內(nèi)建立了超過200家實驗室,目前授權專利數(shù)量已經(jīng)超過16000萬,境內(nèi)專利占比55%。

令人興奮的是,就在今天的開發(fā)者大會上,小米方面宣布面向第三方APP開放相機三大能力,包括長焦、超廣角、微距、多攝同開的硬件能力,以及美顏、超級夜景、超級防抖等軟件能力。

同時,小米也將基于影像處理能力為IoT設備賦能,讓IoT設備在影像處理方面實現(xiàn)“質(zhì)變”。

雷軍:小米模式是“互聯(lián)網(wǎng)+制造”,明年再招5000名工程師

就在今年8月份的十周年發(fā)布會上,雷軍就成表示,小米的模式的已經(jīng)從互聯(lián)網(wǎng)發(fā)展為現(xiàn)在的“互聯(lián)網(wǎng)+制造”。

在今天的開發(fā)者大會上,雷軍再次強調(diào)小米的“互聯(lián)網(wǎng)+制造”模式,致力于幫助工廠實現(xiàn)智能化、自動化、無人化升級。與此同時,雷軍也提到了第二期智能工廠的規(guī)劃,“規(guī)模要大10倍,爭取做到一個人沒有!

緊接著,雷軍也表示,小米的重點是突破硬核科技,而人才是創(chuàng)新之源。

依據(jù)計劃,小米原本今年要擴招3000人,不過由于疫情的影響拖慢了擴增的步伐,最終只招納了2800多人。

至于明年的擴招計劃,雷軍也在現(xiàn)場立下目標——擴招5000名工程師,并公布了人員招募的10個重點領域:

小米開發(fā)者大會三大關鍵詞:相機影像、小愛同學和AIoT

作者:韓璐

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號