MSCBSC 移動通信論壇
搜索
登錄注冊
網絡優(yōu)化工程師招聘專欄 4G/LTE通信工程師最新職位列表 通信實習生/應屆生招聘職位

  • 閱讀:806
  • 回復:0
MIT與谷歌開發(fā)新系統(tǒng) 可以在手機上美化圖片
mao_mao
論壇副管
鎵嬫満鍙風爜宸查獙璇? style=


 發(fā)短消息    關注Ta 

C友·鐵桿勛章   管理·勤奮勛章   C友·進步勛章   管理·優(yōu)秀勛章   C友·貢獻勛章   “灌水之王”   紀念勛章·七周年   管理·標兵勛章   活動·積極勛章   財富勛章·財運連連   財富勛章·大富豪   財富勛章·小財主   專家·終級勛章   財富勛章·神秘富豪   C友·登錄達人   紀念勛章·五周年   財富勛章·富可敵國   財富勛章·財神   財富勛章·富甲一方   財富勛章·鉆石王老五   活動·第二屆通信技術杯   紀念勛章·六周年   活動·攝影達人   紀念勛章·八周年   紀念勛章·九周年   紀念勛章·十周年   C友·技術大神  
積分 428896
帖子 85070
威望 5258128 個
禮品券 5423 個
專家指數 3546
注冊 2009-4-24
專業(yè)方向  移動通信
回答問題數 0
回答被采納數 0
回答采納率 0%
 
發(fā)表于 2017-08-02 20:24:01  只看樓主 

  新浪科技訊 北京時間8月2日消息,今天,數碼相機捕捉的數據往往只是生成最終照片的原始數據。在我們將照片傳到社交網絡之前,即使只是普通的手機攝影師,也會花1分鐘或者2分鐘調節(jié)色彩和對比度,用圖片處理軟件處理,現在市場上有很多這樣的軟件。

  在本周舉辦的Siggraph會議上,麻省理工學院(MIT)計算機科學與AI實驗室和谷歌的研究人員展示了一套新系統(tǒng),它可以自動按專業(yè)攝像師的處理方式潤飾圖片。系統(tǒng)相當節(jié)能,可以在手機上運行,處理速度很快,可以實時顯示潤飾的圖片,這樣一來攝影師可以一邊拍攝一邊查看最終圖像。

  MIT與谷歌合作

  不只如此,這套系統(tǒng)還可以讓現有的圖像處理算法加速運行。谷歌有一套算法可以生成HDR圖像,在標準數字圖片中有些色彩細節(jié)會丟失,谷歌算法卻可以捕捉到細節(jié),研究人員在測試中發(fā)現,新系統(tǒng)生成的圖像與谷歌算法生成的圖像很難區(qū)分,但所用的時間只有十分之一,速度足夠快,完全可以實時顯示。

  MIT與谷歌開發(fā)的系統(tǒng)是一套機器學習系統(tǒng),也就是說它可以通過分析訓練數據不斷學習,提高完成任務的技能。在MIT系統(tǒng)中,每一次學習新任務都要用幾千對圖片進行訓練,包括原始圖片和潤飾圖片。

  系統(tǒng)是根據MIT研究人員之前從事的項目開發(fā)的,在之前的項目中,研究人員用手機將低分辨率圖片發(fā)送到網絡服務器,服務器發(fā)回“轉化方案”,用它就可以在手機上對高清版本的圖片進行潤飾,這樣就可以降低帶寬要求。

  MIT電子工程、計算機科學研究生邁克爾·加哈比(Micha?l Gharbi)說:“谷歌聽到了我們在做這樣的研究,他們自己也跟著研究,我們見了面,將兩套方案整合在一起?偟臉嬒胧沁@樣的:要做我們之前所做的所有事,但是必須在云端處理一切,不斷學習。學習的第一目標就是加快速度!

  兩種關鍵技術

  在新系統(tǒng)中,大量的圖片處理任務是用低分辨率圖片完成的,這樣就可以大大縮短時間,降低能耗。采用新方法帶來許多困難,因為機器學習系統(tǒng)輸出的結果粗糙很多,新技術必須從粗糙結果推斷出高清圖像單個像素的顏色數值。

  以前,研究人員嘗試讓機器學習系統(tǒng)學會一門技巧:增強低分辨率圖片,系統(tǒng)會猜測遺漏像素的數值,然后提升分辨率。在訓練時,研究人員向系統(tǒng)輸入低分辨率圖片,最終輸出的卻是高分辨率圖片。方法看起來很好,但在實際應用中效果不好,為什么?因為低分辨率圖片丟掉太多的數據。

  加哈比與同事用兩種技術解決此問題。首先,機器學習系統(tǒng)輸出的結果不是圖片,而是一組簡單的公式,它可以對圖片的像素色彩進行修改。在訓練時,系統(tǒng)的性能如何由輸出公式的表現來決定。

  如何將公式應用于高分辨率圖片的單個像素?那就要靠第二項關鍵技術。研究系統(tǒng)輸出的是3D網絡,16x16x8。網絡16x16的一面對應原圖像的像素位置,上面會堆疊共8層,它們對應不同的像素強度。每個網格單元都會有一個公式,它決定如何對源圖像的色彩數值進行修改。

  在網絡16x16的一面有許多單元,每一個單元代表高清圖片的幾千個像素。假設每一組公式對應單元中央的一個位置,那么方塊內每一個高清像素都是由四組公式決定的。

  簡單來說,該像素的色彩數值如何修改由方塊四角的公式組合之后決定,它會根據距離判斷。網絡的第三維也這是樣判斷的,也就是對應像素強度的那一面。

  速度大幅提升

  研究人員用Durand和Adobe的數據集訓練系統(tǒng)。數據包括5000張圖片,每一張都由5位攝像師潤飾過。然后研究人員用幾千張配對圖片訓練系統(tǒng),這些圖片是用流行圖片處理算法生成的,比如當中有一套算法專門生成HDR圖片。軟件處理圖片時占用的內存空間與一張數碼照片差不多,因此我們可以將軟件裝進手機,用手機將圖片處理成各種風格。

  最后,研究人員將還將自己的系統(tǒng)與其它機器學習系統(tǒng)對比,其它機器學習系統(tǒng)處理高分辨率圖片,不是低分辨率。在處理過程中,全分辨率圖片需要12GB的內存執(zhí)行操作,而研究人員的新系統(tǒng)只要100MB左右,相當于1/100。全分辨率HDR系統(tǒng)的處理時間相當于原始算法的10倍,相當于MIT系統(tǒng)的100倍。(德克)


掃碼關注5G通信官方公眾號,免費領取以下5G精品資料
  • 1、回復“YD5GAI”免費領取《中國移動:5G網絡AI應用典型場景技術解決方案白皮書
  • 2、回復“5G6G”免費領取《5G_6G毫米波測試技術白皮書-2022_03-21
  • 3、回復“YD6G”免費領取《中國移動:6G至簡無線接入網白皮書
  • 4、回復“LTBPS”免費領取《《中國聯通5G終端白皮書》
  • 5、回復“ZGDX”免費領取《中國電信5G NTN技術白皮書
  • 6、回復“TXSB”免費領取《通信設備安裝工程施工工藝圖解
  • 7、回復“YDSL”免費領取《中國移動算力并網白皮書
  • 8、回復“5GX3”免費領取《 R16 23501-g60 5G的系統(tǒng)架構1
  • 對本帖內容的看法? 我要點評

     
    [充值威望,立即自動到帳] [VIP貴賓權限+威望套餐] 另有大量優(yōu)惠贈送活動,請光臨充值中心
    充值擁有大量的威望和最高的下載權限,下載站內資料無憂

    快速回復主題    
    標題
    內容
     上傳資料請點左側【添加附件】

    當前時區(qū) GMT+8, 現在時間是 2025-01-09 17:20:35
    渝ICP備11001752號  Copyright @ 2006-2016 mscbsc.com  本站統(tǒng)一服務郵箱:mscbsc@163.com

    Processed in 0.280928 second(s), 13 queries , Gzip enabled
    TOP
    清除 Cookies - 聯系我們 - 移動通信網 - 移動通信論壇 - 通信招聘網 - Archiver