“驗證碼的進步就是一個‘研究、破解、提升、再破解、再彌補’的過程,國際、國內(nèi)的許多公司常向我們尋求建議?!?013年,各大網(wǎng)站紛紛推出空心驗證碼,它打破了傳統(tǒng)的實心字體的模式,用輪廓線的空心字體替代。這樣當(dāng)多個字符重疊粘連的時候,機器識別度較差,但是人類仍然可以很好的識別。但高海昌發(fā)現(xiàn),只需先將空心填充成實心字符,使用顏色填充算法得到離散的筆畫塊。然后使用卷積神經(jīng)網(wǎng)絡(luò)和深度優(yōu)先算法對筆畫塊進行組合識別,尋求最優(yōu)解作為識別結(jié)果,此類驗證碼也可就此被破解。
“我們針對Yahoo、百度、新浪、騰訊、和中國移動在線支付網(wǎng)站的空心驗證碼分別取得了36%、51%、59%、89%和66%的成功率?!贝顺晒难芯课恼隆癟he robustness of hollow CAPTCHAs”被密碼學(xué)和信息安全領(lǐng)域享有崇高聲譽、公認(rèn)的頂級國際學(xué)術(shù)會議之一的ACM CCS 2013正式錄用,這也是中國大陸研究機構(gòu)首次有論文在這個高檔次會議上發(fā)表。
“Yahoo和騰訊等公司的空心驗證碼被攻破后,也主動聯(lián)系我們,希望我們能對其驗證碼改進提供幫助。如今,騰訊公司每當(dāng)推出新型驗證碼后,總會首先讓我的團隊試一試能否破解。”高海昌說,“驗證碼可以防止濫用網(wǎng)絡(luò)資源,與普通人生活息息相關(guān),是網(wǎng)絡(luò)安全的第一關(guān)?!?/p>
未來方向:“破”與“立”中守護互聯(lián)網(wǎng)安全
當(dāng)文本驗證碼被證明不再安全,尋找可使用簡便、安全性又高的新驗證碼,便成了高海昌目前工作的重點。“‘破’是為了更好地‘立’。想要設(shè)計新型的驗證碼,就需綜合考慮當(dāng)前圖像處理和人機交互領(lǐng)域的最新進展和成果,盡力挖掘出人類擅長處理而計算機AI算法不擅長的。”高海昌說,“這個過程中,最難的便是如何保證驗證碼不易被破解,同時還實現(xiàn)用戶友好?!?/p>
近日,高海昌正致力于研究一種十分巧妙的新型圖片驗證碼。“現(xiàn)有計算機無法破解,方法也很簡單?!备吆2榻B說,“在背景圖片上自動生成幾個線條不連續(xù)不均勻、形狀不規(guī)則的幾何圖形,圖形之間相互交疊,背景中再加入一些短線條作為噪點,就構(gòu)成我們正在提出的新型圖形驗證碼。人類很容易分辨,計算機卻難以區(qū)分識別這些不規(guī)則幾何圖形的邊界?!苯?jīng)試驗,尚沒有計算機程序能有效破解高海昌團隊所提出的新驗證碼。人類數(shù)起來很簡單,又能有效阻擋惡意程序,在文本驗證碼被證明不再安全、深入研究失去意義時,這種巧妙的驗證碼或許為今后相關(guān)領(lǐng)域的研究提供了一個值得深入探索的方向。
“缺點也并非沒有。因同一個圖片中圈的數(shù)量不能太多,否則人類也可能難以數(shù)清;數(shù)量很少的情況下,計算機存在通過多次猜測猜中驗證碼的可能。針對這種情況,我們將圖片的數(shù)量增加到5張,平均每張1到10個圈。如此,只需短短幾秒人類便可輕松通過驗證碼,同時安全性也大大提高?!蹦壳?,此驗證碼的研究文章已投給相關(guān)雜志。
盡管文字驗證碼已被證明不安全,但因其使用的便捷性,以及新型驗證碼機制的不成熟(如典型的12306圖像驗證碼),尚不可能完全被取代。“圖形驗證碼比文本驗證碼先進,這也是技術(shù)發(fā)展的趨勢。谷歌就推出了將任意圖片切成圓形生成驗證碼,然后將圖片旋轉(zhuǎn),用戶在使用時只需將角度轉(zhuǎn)正即可。這種驗證碼機器識別難度同樣很大。某些網(wǎng)站也推出了手機短信驗證等新型驗證碼,這是文本或圖片驗證碼很好的替代方式,但對服務(wù)器要求頗高。”高海昌說。
“驗證碼的研究是小步前進的,每次進步都是已有成果上的小幅推進,想要提出一種全新的驗證碼,達(dá)到魯棒性和可用性的最佳平衡,目前來說難度還很大?!备吆2f,“但安全無小事,技術(shù)上不能開倒車,在未來,運用指紋、虹膜等生物特征作為驗證碼得到普及也有可能實現(xiàn)的一天。堅持下去,驗證碼的發(fā)展或許會有翻天覆地的變化?!?/p>
在這場“破”與“立”的拉鋸戰(zhàn)中,高海昌樂在其中。
(文/西電新聞網(wǎng)·付一楓)