推薦序

作為一位機器學習領域研習10年以上的專業技術人員,我當初入行的時候沒有想到,短短的10年間,這項技術會如此快速地改變眾多行業,並影響全球數十億用戶生活的方方面面。在今天,當你用今日頭條瀏覽新聞資訊的時候,當你用網易雲音樂查看推薦歌單的時候,當你在百度搜索信息的時候,當你在互聯網金融平台申請借款的時候,甚至在你調戲Siri和小冰的時候,其實都是其背後的機器學習算法在雲端服務器中為你默默服務。但對於這樣一種重要技術,市面上一直缺少一本適合普通讀者的入門科普讀物,而眾多的專業書籍要求讀者具備一定的高等數學和計算機基礎算法知識,並不適合科普的需要。直到中信出版社的朋友將這本書的翻譯稿推薦給我時,我欣慰地發現,這正是想瞭解一點機器學習的普通讀者所需要的啊。本書的作者多明戈斯是華盛頓大學的終身教授,也是一位在機器學習領域具有20年研究經歷的資深科學家。多明戈斯一直致力於融合各種機器學習算法的優勢,提出一種可以解決所有應用問題的通用算法,即終極算法。在這本書裡,作者詳細地闡述了他的思路。其實我個人在閱讀本書的過程中,始終對「終極算法」的提法充滿懷疑。在我看來,機器學習作為人工智能領域的主流技術,在現實社會中一直以技術工具的面目為人所知。不同的技術流派和相應算法往往可以很好地解決一些問題,卻對另一些問題一籌莫展。所謂的終極算法真的存在嗎?如果存在,有價值嗎?

可以拿內燃機舉個例子,就我這個外行來說,也知道存在活塞式發動機、渦噴發動機、渦軸發動機、渦扇發動機、渦槳發動機、沖壓發動機等不同種類的內燃機。不同的內燃機特性迥異,適用的工況也不盡相同。小到家用小汽車,大到導彈驅逐艦,人類製造的各種機動設備,都可以根據自己的效率需求、動力需求、壽命需求,乃至啟動速度等多種需求維度選擇發動機種類。如果有人非要搞個終極內燃機,並企圖用這種內燃機替代現存的各類內燃機,為所有大大小小、需求不同的機動設備提供統一動力,估計大概率是要失敗的。這種通用的終極內燃機如果能搞出來,在大部分領域肯定競爭不過各領域的專用內燃機,或者成本太高,或者能效太低。

帶著這種疑問,我通篇讀下來之後才發現作者的另一層用意。誠如作者所說,很多普通人可能沒有意識到自己的生活中機器學習算法的影響已經無處不在,機器學習已經在逐漸接管現實世界。大眾對這樣一種技術的認知程度和該技術的重要性相比顯得遠遠不夠,在不遠的未來,瞭解機器學習並有能力利用機器學習改進自己工作的人在職業發展上會具備巨大的優勢。「不要和人工智能對抗,要讓人工智能為你服務」是作者誠摯的忠告。而要利用好機器學習這個工具,並不一定需要讀一個計算機博士學位,但有必要瞭解一些基本的概念,瞭解各種技術的優缺點和能力邊界。正如一位稱職的駕駛員不必瞭解具體怎麼製造汽車發動機,但是對發動機的工作原理和種類還是需要略知一二的。因此,相比一板一眼地介紹機器學習的典型算法,作者設計了一個更引人入勝的套路:先拋出一個「是否存在一種終極算法」的問題,然後帶著讀者一章一章地回顧機器學習發展史上的重要流派和代表算法。每回顧一派,就鼓勵讀者思考終極算法應該如何借鑒這類算法的優點。好奇的普通讀者帶著疑問讀完本書後,不論其是否相信終極算法的存在,至少對各類算法都會有一定的印象。以討論終極算法為名,行科普之實,到這一步,我覺得作者的目的已經達到一半了。

另外,在文末作者還提到,無論終極算法是否存在,他希望這個大膽的問題能夠激發部分讀者的好奇,甚至被這個問題吸引成為機器學習的專業研究人員。確實,每一種學科都需要至高的理想驅動向前,就如同物理的大一統理論,當無數傑出的天才為一個終極問題孜孜以求時,就算這個問題本身在這些人的有生之年可能沒有答案,但是這個學科一定會因為這些偉大的探索歷程取得輝煌的進步。我想,這也許是作者因為對機器學習的熱愛夾帶的另一個私貨吧。

作為今日頭條的一位算法架構師,我倒是希望頭條用戶都能陷入作者的「圈套」,帶著好奇心,好好讀讀這本書。如果大多數用戶都能瞭解一些機器學習的基礎知識,應該就能夠更好地和推薦算法互動,不斷把算法調教得更好,更符合自己真正的興趣,而不會因為算法一開始推薦的內容不好就放棄這個產品。誠如作者所說,也許在未來,對應人類的心理學,也會出現機器心理學,瞭解一點機器人的心理,會讓你和機器的互動更有效率,也會讓機器更快地成為你忠實、不知疲倦的助手。

曹歡歡 今日頭條首席算法構架師

《終極算法:機器學習和人工智能如何重塑世界》