失誤or作弊?百度人工智能遭遇刷分危機

失誤or作弊?百度人工智能遭遇刷分危機

這一周,百度因為在一個比賽中作弊被推到輿論的風頭浪尖。

2張彩票和200張彩票

事情原委還要回到5月中旬,彼時百度宣稱其在ImageNet(圖像識別最大數(shù)據(jù)庫)的圖像識別測試挑戰(zhàn)賽中擊敗了谷歌微軟,稱其圖像識別錯誤率低至4.58%,而微軟是4.94%,谷歌為4.8%。而在這種測試中,人類辨識ImageNet照片的錯誤率為5%左右。

ImageNet這項比賽的全稱為Imagenet Large Scale Visual Recognition Challenge(ILSVRC),由來自斯坦福大學、密歇根大學以及北卡萊羅納大學教堂山分校的學者舉辦,是目前最權威的圖像識別測試。該測試主要衡量計算機識別圖片中的物件的能力,其原理基本上和百度谷歌都有的識圖應用一致,不過測試的數(shù)據(jù)集規(guī)模極大,標準更加嚴謹詳細。

失誤or作弊?百度人工智能遭遇刷分危機

該比賽從2010年開始舉辦,至今已經(jīng)是第六屆,參與比賽的學術組織和機構(gòu)達到了50余所,大多來自世界知名大學的人工智能研究所以及科技界巨頭企業(yè)如谷歌、微軟等。

參與者需要掃描擁有100多萬張圖片的數(shù)據(jù)庫,將它們歸到1000個不同的類別之中,并對通過識別自動給每張圖片添加注釋,最后將結(jié)果上傳到ImageNet的評估服務器上。最終比賽排名結(jié)果及各項指標將由ImageNet在比賽結(jié)束后審核公布。

然而本月初,ImageNet隨后卻發(fā)文指責百度在測試中存在違規(guī)作弊行為。因為按照測試的官方規(guī)定,參與者每周只能向服務器提交2次測試結(jié)果,而百度卻在5天內(nèi)提交了40次結(jié)果。此外,ImageNet表示,百度還使用了30個不同的賬號,在過去6個月中提交了約200次測試結(jié)果。

通俗的來講,百度這種做法可以理解為在其他團隊只購買2張彩票的情況下,它卻購買了200張彩票以提高中獎概率。

ImageNet將此情況通報給了所有參賽團隊,對百度的成績予以否認并禁止百度1年內(nèi)不得參加該比賽。

百度的不遺余力

與谷歌類似,百度都是以互聯(lián)網(wǎng)搜索為基礎的技術導向型公司,手頭握有大量的用戶和數(shù)據(jù)積累,對于進行大數(shù)據(jù)挖掘,探索人工智能有著天然的優(yōu)勢。它也確實學著谷歌一樣在各個領域加強自己的創(chuàng)新技術探索,人工智能就是其中極為重要的一部分。

在人工智能這個大領域百度的探索和研究都可謂不遺余力,且在多個細分小類別都有巨大的投入。

其中,就包括引進權威人才吳恩達及組建硅谷研究中心。2014年5月,百度宣布在美國硅谷成立人工智能的專門研發(fā)中心,并從谷歌挖來了深度學習權威學者吳恩達(Andrew Ng)任命其為百度深度學習研究院首席科學家。吳恩達不僅是斯坦福大學計算機科學和電子工程學的學術風向標,更因其一手創(chuàng)建并領導了谷歌深度學習團隊,被業(yè)界譽為“谷歌大腦之父”,百度能聘到這樣的權威級人才實屬不易,可見其重視和投入。

去年底,美國《福布斯》發(fā)布文章稱,吳恩達及研究團隊發(fā)明了一種新的語音識別方法,這款基于深度學習的名為“Deep Speech”語音識別系統(tǒng)可以在嘈雜環(huán)境下實現(xiàn)將近 81% 的辨識準確率??突仿〈髮W工程學助理研究教授Ian Lane對其的評價是“百度研究院最近的工作有可能顛覆語音識別在未來的應用效果?!?/p>

而百度目前在國內(nèi)擁有十幾座云計算中心,為滿足大數(shù)據(jù)在計算和存儲上的高要求,還投入使用了4萬兆交換機,并在探索10萬兆的交換機。百度在GPU高性能計算機上的投入也是十分下血本,其美國研發(fā)中心的科學家吳韌稱百度在2013年剛開始準備組建Minwa超級計算機的時候,購買量在國內(nèi)達到了第二,“拿不到第一是因為天河當然得是第一”。

此外,去年9月百度宣布已經(jīng)與寶馬正式簽署合作協(xié)議,共同研發(fā)自動化駕駛技術。利用其地圖大數(shù)據(jù)資源對寶馬的車輛導航系統(tǒng)給予支持。而一系列有著人工智能氣息的獨特產(chǎn)品如BaiduEye、筷搜等也是一時之間占據(jù)各大科技頭條。

雖然其中一些產(chǎn)品的宣傳意義遠大于實際意義,但我們也可以從中看出百度人工智能領域的重視。甚至,一些國內(nèi)外媒體都將其直接和谷歌、微軟、Facebook等國際科技巨頭相提并論。由此“百度人工智能”的名聲也隨著水漲船高,旗下科學家也是頻發(fā)論文、四處講演等,博得了不小的學術聲譽。

國際同行的口誅筆伐

百度ImageNet違規(guī)作弊事件也許在普通公眾看來好像并沒有什么大不了的,不就是參加測試不規(guī)范鉆了個空子么?但這對于百度在人工智能圖像識別這個學術領域的國際地位是沉重的打擊。

國際學術界各大評測和比賽的主旨是希望通過競爭促進研究發(fā)展,所制定的各種規(guī)則也一般都主要靠參與者的自律,其他國家的學者更關心的都是該領域的真正進展,而不僅是最后的成績排位,違反學術誠信的事情即使可能不被發(fā)現(xiàn)一般也堅決不會去做的。結(jié)果百度一來參加這個比賽就被發(fā)現(xiàn)作弊,這在學術界絕對算讓人大跌眼鏡的事情。

不少國際學者對百度此舉也是不留情面地批評諷刺,美國艾倫人工智能研究所的CEO Oren Etzioni將百度比喻為瘋狂買彩票的投機彩民;而加州大學一名計算機科學界Jitendra Malik更是用嗑藥來諷刺百度:“如果你100米跑出了9.5秒,但你實際上是嗑藥吃興奮劑才取得的,那這個成績怎么可信呢?”

截至目前,百度對此并沒有對此事件進行公開回應,不過ImageNet官網(wǎng)公布了一封據(jù)稱為百度深度學習小組的科學家Ren Wu的道歉信,信中Ren Wu稱此次事件為一次“失誤”:我們已經(jīng)在論文中添加了注釋……并將繼續(xù)提供相關更新。

當然,這種解釋信不信由你了。

 

北京app開發(fā)公司 | app開發(fā) | app開發(fā)公司 | 企業(yè)品牌App開發(fā)移動互聯(lián)網(wǎng)解決方案 | 一站式o2o app開發(fā)大數(shù)據(jù)解決方案 | 智能設備APP開發(fā)商

發(fā)表評論