今年年初,谷歌推出了一項(xiàng)名為“谷歌大腦”的深度學(xué)習(xí)項(xiàng)目,能夠把只有64個(gè)像素(8X8)的模糊圖片,變成更清晰的圖片。這項(xiàng)被稱為“黑科技”的技術(shù)驚艷了很多人,帶動(dòng)了AI圖像學(xué)習(xí)的熱潮,也使得人們對(duì)視頻有了更多新的想象。
11月29日,第五屆中國(guó)網(wǎng)絡(luò)視聽(tīng)大會(huì)在成都召開(kāi),作為中國(guó)網(wǎng)絡(luò)視音頻領(lǐng)域規(guī)格最高,被稱為“年度風(fēng)向標(biāo)”的行業(yè)盛會(huì),本次會(huì)議以“新使命·新視界·新動(dòng)能”為主題,邀請(qǐng)了網(wǎng)絡(luò)視聽(tīng)業(yè)界和學(xué)界的領(lǐng)軍人物共聚一堂,共同探討中國(guó)網(wǎng)絡(luò)視聽(tīng)行業(yè)的現(xiàn)在與未來(lái)等熱點(diǎn)話題。金山云高級(jí)副總裁、合伙人梁守星受邀出席本次會(huì)議并發(fā)表《AI,讓視頻更有溫度》的演講,對(duì)人工智能與視頻行業(yè)結(jié)合的新技術(shù)以及未來(lái)發(fā)展進(jìn)行了分享。

金山云高級(jí)副總裁、合伙人梁守星在中國(guó)網(wǎng)路視聽(tīng)大會(huì)現(xiàn)場(chǎng)演講
梁守星表示,人工智能作為一項(xiàng)具備高度信息識(shí)別能力的創(chuàng)新技術(shù),已成為社會(huì)進(jìn)步的主旋律,并受到越來(lái)越多行業(yè)的關(guān)注。據(jù)有關(guān)統(tǒng)計(jì)數(shù)據(jù)顯示,目前AI領(lǐng)域創(chuàng)業(yè)的企業(yè)中,有一半以上都專注在計(jì)算機(jī)視覺(jué)、服務(wù)機(jī)器人以及語(yǔ)言和自然語(yǔ)言處理等方面,并在不斷向電商、金融、教育、醫(yī)療等各垂直行業(yè)滲透。“AI在自身技術(shù)迭代并向各行業(yè)滲透的過(guò)程中,一個(gè)新的富媒體時(shí)代也隨之而來(lái),并將助力用戶體驗(yàn)升級(jí),成為視頻的終極演進(jìn)?!绷菏匦茄a(bǔ)充道。
“AI畫質(zhì)+”還原高清讓媒體“富”起來(lái)
自19世紀(jì)中葉,人們初次接觸視頻影像起,視頻技術(shù)一直在圍繞如何讓畫面更清晰、傳輸更穩(wěn)定的方向進(jìn)步。進(jìn)入移動(dòng)互聯(lián)網(wǎng)時(shí)代后,AI技術(shù)豐富了人們對(duì)視頻的想象。它將不再扮演單一載體形式,可以與各行各業(yè)結(jié)合,以智能穿戴設(shè)備屏幕、醫(yī)療影像等各種形態(tài),幫助教育、醫(yī)療、安全行業(yè)實(shí)現(xiàn)全面升級(jí)。
不過(guò),在AI出現(xiàn)之前,這種升級(jí)面臨較大技術(shù)難度。一方面受限于編解碼技術(shù)能力和網(wǎng)絡(luò)環(huán)境,另一方面網(wǎng)上的圖像和視頻越來(lái)越多,存儲(chǔ)與傳輸這些圖像和視頻的成本也就越來(lái)越高。如何在片源不清晰,或者經(jīng)過(guò)壓縮后還能呈現(xiàn)出高清效果,成為大家亟需解決的問(wèn)題。
梁守星表示,基于深度學(xué)習(xí)能力的超分辨率算法和畫質(zhì)修復(fù)算法,可為視頻提供商和用戶大幅節(jié)省存貯成本與傳輸帶寬,化解成本壓力。目前,金山云已推出基于這兩項(xiàng)算法的“AI畫質(zhì)+“圖像增強(qiáng)技術(shù),并實(shí)現(xiàn)在移動(dòng)端將高清視頻壓縮成低分辨率視頻進(jìn)行傳輸。
據(jù)了解,金山云”AI畫質(zhì)+”圖像增強(qiáng)技術(shù)能為不同分辨率、不同類型的視頻訓(xùn)練出不同的模型及模型參數(shù),再通過(guò)搜索其他類似經(jīng)過(guò)壓縮的高分辨率視頻圖像,尋找圖案、顏色的相似關(guān)系,進(jìn)行視頻還原和修復(fù)。這樣,在接收端將低分辨率視頻還原成高清視頻時(shí),可以做到實(shí)時(shí)進(jìn)行,完全不會(huì)影響到用戶的視覺(jué)體驗(yàn)。

270p視頻幀經(jīng)普通的雙線性插值(左)和金山視頻云算法放大四倍的效果(右)
如果說(shuō)超分辨率技術(shù)解決的是高清圖像在傳輸過(guò)程中的高成本問(wèn)題,那么對(duì)那些由于硬件設(shè)施較差、網(wǎng)絡(luò)環(huán)境欠佳、拍攝時(shí)間久遠(yuǎn)、畫面抖動(dòng)等等導(dǎo)致畫質(zhì)損傷的片源,金山視頻云則可以通過(guò)視頻修復(fù)算法進(jìn)行修復(fù),它可應(yīng)對(duì)各種突發(fā)情況導(dǎo)致的畫質(zhì)損傷,將視頻中的馬賽克,毛刺,重影,噪點(diǎn)等實(shí)時(shí)修復(fù)為較好的畫質(zhì),提升用戶的視頻體驗(yàn)。
金山云火眼“金睛”守護(hù)網(wǎng)絡(luò)潔凈安全
視頻行業(yè)高速發(fā)展,在帶給人們豐富信息的同時(shí),危害社會(huì)健康和安全的涉黃、暴力、詐騙等信息業(yè)蜂擁而至。如果只靠人工審核來(lái)保持網(wǎng)路環(huán)境的潔凈安全,這將是一項(xiàng)耗時(shí)耗力的巨大工程。
為此,金山云基于KDL深度學(xué)習(xí)算法,借助每日千萬(wàn)級(jí)海量圖片庫(kù)訓(xùn)練出精準(zhǔn)AI算法模型,打造出業(yè)內(nèi)領(lǐng)先的一站式AI內(nèi)容安全監(jiān)管平臺(tái)——金山云金睛。它可提供快速智能圖像識(shí)別,支持“鑒黃”、“暴恐”、“涉政”、“廣告識(shí)別”等多種圖像智能識(shí)別服務(wù),同時(shí)提供“直播實(shí)時(shí)AI安全監(jiān)管服務(wù)”,“短視頻AI安全審核”解決方案,準(zhǔn)確率高達(dá)99.9%以上。人工審核萬(wàn)張圖片成本要幾十元甚至上百元,而使用金山云金睛平臺(tái)只需要幾塊錢,能帶來(lái)80%以上的成本節(jié)省。
梁守星表示,移動(dòng)互聯(lián)網(wǎng)視頻的最大特點(diǎn)是更新快,實(shí)時(shí)性強(qiáng)。實(shí)時(shí)性方面,金山云通過(guò)圖片、聲音、文字等多層識(shí)別監(jiān)督,可以保證監(jiān)管無(wú)死角。在準(zhǔn)確地識(shí)別各種不合規(guī)視頻方面,金山云在強(qiáng)大的計(jì)算能力外,沉淀了海量圖片,目前擁有1.2億海量數(shù)據(jù)標(biāo)注,并每天24小時(shí)不間斷識(shí)別。
隨著蘋果、谷歌、高通等巨頭在AI芯片領(lǐng)域的發(fā)力,視頻將會(huì)迎來(lái)一個(gè)高速發(fā)展階段。未來(lái),金山云將基于深度學(xué)習(xí)能力,充分打造視頻超分辨率和視頻修復(fù)技術(shù),滿足人們對(duì)4K視頻高清的體驗(yàn)的觀看體驗(yàn)追求,同時(shí)將會(huì)增強(qiáng)包含聲音、圖片等多層實(shí)時(shí)視頻鑒別監(jiān)控技術(shù)能力,為視頻和各行業(yè)的發(fā)展保駕護(hù)航!