人工智能應用或將超越人類背後的深思

來源：文萃谷 2.75W

目前的AI技術已經有了長足的進步，神經元算法帶來的改善不容小視。這些智能算法被應用在人臉識別系統、智能手機助理系統以及谷歌自動駕駛汽車中。所以，不只是小編，大多數人都認為能只注重讓人工智能變得更強大，同樣要保證其健康性和有益性：AI 必須遵從人類的意願，不能胡作非為。

　　你為什麼堅持人工智能研究必須以可證實對人類有益為前提?

我認為這是一個錯誤的問題，因為“人類價值”不能被“證實”。當然，人類價值本身也沒有準確的定義，誰又知道人類為什麼存在呢，可能這永遠都是個迷。但考慮到我們人類的行為的意義，你會希望機器人至少能體會到其中的大部分精髓。人工智能可能不能完全理解我們的所作所為，但它們至少要和我們站在同一戰線上，有着共同的基本原則。換句話説，它們不能成為我們的絆腳石甚至傷害我們。

　　你打算怎麼實現這一點?

我現在正在這方面努力。目前我覺得一種名為“逆強化學習”的技術可以派上用場。平常的學習原理很簡單，基於你的表現好壞，你會得到獎勵或者懲罰，你的目標也很明確，就是想方設法獲得儘可能多的獎勵。Atari的遊戲就是一個這樣的典型的系統。逆向學習則是完全相反的'過程，你首先得到結果，然後你去思考什麼樣的行為最可能帶來這樣的結果。比如，你的機器人看到你早上艱難的從牀上爬起來，衝了一杯咖啡，在一個嗡嗡作響的箱子里加熱了點煎餅，而且在吃這些東西時你臉上浮現出了愉快的深情，那麼它的人工智能就會告訴它：人早上喝咖啡是好的。

逆強化學習有着海量的資料可以使用，無論是書籍、電影還是網絡，上面有着成千上萬的人類活動記錄，智能體可以從中感受到人類追求的基本價值和遵循的基本原則。

你的研究生涯主要關注了理解人工智能是什麼，並認為這是實現人工智能的前提。那麼你目前有什麼收穫呢?

在八十年代的研究中我開始思考理性決策的問題，後來我發現這是一個不可能完成的任務。如果你是理性的，你會判斷自己目前的狀況、可選擇做法、每種做法帶來的結果，但是又有哪一種做法是百分之百確保得到想要的結果的呢?世界上的事情變化多的讓人眼花繚亂，沒有那麼多事是確定的。理性行為的定義就要求你的能力蓋過整個未來和宇宙，換句話説，它在計算上是不可能的。所以我換了思路：那麼人類是怎樣做決定的呢?

　　人類怎麼做的?

人類的大腦是一部效率驚人的概率運算機器。它的訣竅不是準確掌握每一條信息，而是對未來有一個大概的預測，並推測最可能帶來好結果的做法。拿下棋來説，如果是理性決策的人，他就只會走那些可以將軍的棋子。現實中沒有人這麼下棋，人們不會考慮十幾步之後的事情，他們會考慮幾個可能的走法，看哪一種最可能帶來優勢。人一生大約會做20萬億的動作，做一次演講會有13億個動作，理性決策要求你預測13億個動作後的準確狀況，這太瘋狂了。我們從不會想“我要先邁左腳再動右腳，再打開門……”而是想“我該去做演講了”。

　　你可以證明人工智能系統不會重寫自己的軟件，覆蓋人類預設的目標嗎?

計算機程序有着許多不確定性。阿蘭圖靈曾指出一個計算機程序不可能判斷另一個程序是陷入了無限循環還是最終會產生輸出。因此，如果你有一個可以重寫自身的程序，你就有了一個矛盾，你不能證明這個新程序是否具有某些性質，這個程序也不知道自己寫了一個什麼。所以，問題不是“AI是否會重寫自己”而是“AI寫出的程序會對我們有怎樣的影響”。我們目前對人工智能的設計能力所知甚少。

　　目前有什麼很有前景的研究領域嗎?

最近出現了一種叫做“網絡現實系統”的研究領域，它們的研究內容是計算機與現實世界相聯，讓電腦通過網絡控制機器手臂等等。許多電影中出現了人工智能掌控交通的劇情，也是該領域的研究內容。另外，空中交通管制也是其應用的一種。

人工智能超越人類