2016-03-30
科幻小說中經常把人類的未來想象成人工智能將會有至高無上的統領權,並且取代人類,完成人類一切可以完成的事情。坦率地講,當這樣的科幻場景開始引入科學技術的時候,並沒有太多的好處,因為它會讓人類對於“什麼樣的人會做好事”和“類似深度學習的其他什麼樣的高科技可以做得更好”這兩個問題失去專註能力。
在數據科學世界的深度學習領域當中,我們正在大跨步的向前邁進。我們已經取得了如此巨大的進步,以至於人們會有這樣的想法:我們不需要欣然接收數據科學的那些繁文縟節,取而代之的是我們只要再稍微等一下,我們就可以擁有類似Waston這樣的盒子來為我們執行一切事務。如果你真是如此設想的話,那麼你將要錯失良機,接下來就是其中的原因。
人類和機器
1. We Dole Out the Work 人類可以派發工作
深度學習以及大部分的數據科學技術,他們的任務處理能力都被限制在一個相對狹隘的範圍內。深度學習一詞是對於目前階段機器學習的最高級形式的一種描述。機器學習作為一個程序系統,其目的就是通過對採用多種統計與算法技術的基於原始數據的複雜模式的觀察,發現其中你想要的數據。深度學習技術在圖像識別或者其他數據集的某些特性方面以及對於感知任務的有效處理能力,得到了廣泛地驗證。大多數情況下,你可以將龐大的處理過程化解為一個更加簡單的模型,這樣你就可以預測出某些事情,而且可以從中找到某些隱藏的提示。深度學習技術的成功代表作包括翻譯(比如谷歌翻譯和百度翻譯)和語音識別(包括蘋果手機的Siri和Google Now功能),也包括圖像識別,甚至還可以玩視頻遊戲以及放飛直升機模型。
如今,我們沒有理由不為深度學習取得的勝利成果歡呼雀躍。但是迄今為止,深度學習系統也能把一些專業化任務完成的很漂亮,而絕非僅僅能夠懂得特定情況下的事務。Zachary Chase Lipton曾經發表了一篇博文,該博文的內容主要是調查了各種指出深度學習系統存在破綻的論文。博文的調查結果證明深度學些系統大都是不堪一擊並且能被輕而易舉地愚弄。深度學習的關鍵點在於它懂得什麼時候這種技術可以運行,什麼時候不運行。
2. We Provide Context 人類提供了場景
無人駕駛汽車本身不知道自己開向哪裡也不知道為什麼要這麼做。我們需要人類提供場景,來形成日常遇到的問題,形成假設的前提並且決定運用什麼樣的深度學習和數據科學。即使當今大多數的先進系統都還是只能把一件任務做得非常完美的“白痴學者”,但是這種系統本身根本不會為自己提供更寬廣的情景。
在任何一種機器學習或者分析問題的領域內,人們所扮演的最重要的角色之一就是決定目標是什麼。建立一個可以優化價值的系統很容易,但是結果卻發現你一開始打算解決的問題就選錯了。在接下來相當長的一段時間內,人類仍舊是唯一的確定難題的主體,也只有人類才能知曉什麼才是真正重要的事情,並且可以核實系統是否能夠像我們所期待的那樣在面對問題領域的直覺理解時發揮預期的功能。
高級系統不知道應該何時將他們自己關閉。在2008年的經濟危機之後,人們選擇關閉很多交易系統項目,因為人們對這些系統所做的假設條件都沒有起到任何幫助作用。在任何情況下,作出關於生死抉擇的提議或者帶有關鍵性經濟後果的系統往往都是需要人類進行監管、改進並且其決定由人類進行批准的白盒系統。
人類 人類場景
3. You Can’t Buy Deep Learning 你無法購買深度學習技術
深度學習以及數據科學技術的服務產品化過程不會很快到來。豐田汽車公司將要為應用到無人駕駛汽車技術的深度學習投資十億美元。到目前為止,無人駕駛汽車並未使用太多的深度學習技術。Google和Facebook正急於將深度學習技術產品化,但是大多數仍舊處於研發階段。這一切看起來前途似錦,但還是讓我們直面現實吧:大多數美國人都在電視上看到過Woston的商業廣告,而不是Woston掌權的產品。
在深度學習和數據科學領域內,真正贏家是那些懂得這些強大工具本身的限制並且可以通過正確的方法利用他們去探索未知世界的公司。那些擁有數據科學技能的聰明人,才是讓你立即或者在未來邁向成功的關鍵所在。
數據科學和機器學習的世界總是讓人感到興奮並將不斷的壯大。誠然,我們必須意識到機器學習仍舊需要藉助人類的維護和監察才能獲得成功。我們必須持續加強並整合商業機構當中的數據科學部門,以便於讓機器和機器之間有更加暢通的交流
上一個案例:从大数据成熟度评估得来的3个有趣的结果
下一個案例:大数据工程师技能图谱