工業 4.0 和大數據兩者關係


大數據時代開始於2001年,我是比較認可這一觀點的。因為大數據這個詞語被創造出來是在20世紀90年代,在2000年的時候第一次在學術論文上有人將它提出,在2003年的時候在FrancisX.Diebolt在《宏觀經濟測量和預測的大數據動態因子模型》一書中正式將大數據這個詞語進行詮釋和應用。自然,在13年前的那個時代,全世界的熱點是在於網際網路,在於網際網路門戶或者社交。

在2005年的時候,當前最火爆的Hadoop項目就已經被創建,之所以在10多年後大數據和Hadoop項目才受到熱捧和關注主要是因為當時的數據還不夠大。

在現如今的世界,隨著網際網路、行動網際網路、IOT、智能設備的發展,你舉目四望會發現整個世界每秒都在生產海量的數據,我們所有的世界空間、所有的行為路徑都在被數據給描述,我們都在生產數據又依賴於數據。在非量子的認知體系內,我們的確處於一個無邊無際的大數據時代,這是一個數據為王、數據即能源的時代。

說一說工業4.0,對於工業4.0這個概念,我認為兩個最權威的定義就可以解釋的明白。
工業4.0這個概念是德國最先提出的,德國對於工業4.0的解釋是這樣的:所謂的工業四代(Industry4.0)是指利用物聯訊息系統(Cyber—PhysicalSystem簡稱CPS)將生產中的供應,製造,銷售訊息數據化、智慧化,最後達到快速,有效,個人化的產品供應。

中國正處在兩化融合升級的過程,因為中國政府迅速與德國政府就工業4.0達成合作,在中德關於工業4.0的《中德合作行動綱要》中,有關工業4.0合作的內容共有4條,第一條就明確提出工業生產的數字化就是工業4.0。現在,我覺得我們可以很好的理解工業4.0的意義,工業4.0就是工業數字化,而更人們興奮的是在工業數字化背後的工業大數據。

工業數字化或者說工業智能化的潛力是顯而易見且令人震撼的,有幸在一個項目中參觀了蒙牛6期工廠,整個智能化、自動化的生產線的確給我了很大的震撼,而且作為一個外行的我就能明白這個是一個多麼有價值有意義的事情。在參觀中,我發現整個蒙牛工廠6期最核心的部分是其設在廠房中央的智能數據控制中心,這個智能數據控制中心的作用就是根據所有設備的運行數據的分析結果控制整個廠房的所有設備進行生產。

根據上週末在廣州與一個朋友聊天的內容,我瞭解到像蒙牛工廠6期的這種智能化設備的控制背後其實就是大數據的深度機器學習控制演算法。那麼,將德國對於工業4.0定義中的供應、製造、銷售三個環節與大數據結合就是工業4.0的供應大數據、製造大數據、銷售大數據,接下來我們就是要圍繞這三個大數據來聊聊大數據時代與工業4.0。

1、供應大數據

說供應大數據可能不太很好的準確理解其所指的是什麼,但是如果說供應鏈大數據你肯定一下就知道其所指的是什麼了。說到供應(鏈)大數據,我相信很多人都能想到一點如何去做供應鏈大數據,因為在這個網際網路和物流發達的年代,全球採購已經不是什麼新鮮事了。在正式切入供應大數據前,我還想先講一個供應鏈的事。在去年,大家可能看到過這樣一個新聞,就是一個浙江蔬菜銷售商春節前從山東採購了一批大蔥,這批大蔥還沒有運到浙江前銷售價格已經漲到其採購價格的10倍以上。

這位蔬菜銷售商之所以在這次生意上能夠躺賺,是因為他通過一些途徑瞭解到了大蔥的主產地山東去年大蔥有了大面積減產的訊息。那麼,對於工業生產而言同樣也是這樣的,只有能夠準確的預測到原材料採購價格的變化趨勢,才能夠通過最優的採購策略來大大的降低生產成本。

在當前的全球經濟的時代,影響工業生產某樣原材料採購價格的因素有如下幾種:全球的生產規模、全球的生產率、期貨市場、國際環境、物流運輸環境、匯率、地緣政治環境、主要生產地的政治環境等等,而這些因素絕大部分都不是直接可以拿到的數據,需要根據每個因素的關聯數據進行分析才能得出。

那麼,在全球的環境下,要進行這些數據的收集、分析、預測只能使用大數據系統來進行。從技術的角度來看這個供應鏈大數據系統,需要由網際網路爬蟲系統、流數據處理系統、數據可視化系統四個主要的核心系統來構成。

網際網路爬蟲系統現在有非常多開源項目可以採用,比較建議的有Nutch、GrubNextGeneration等;流數據處理系統除了目前關注度比較高的Spark還可以考慮Storm和Samza;數據可視化系統可以考慮選擇Cube、FusionChartsSuitXT等,在基礎支撐系統層面可以採用Hadoop的架構體系,也可以採用一些其他的調度系統如Mesos等。

2、製造大數據

所謂製造大數據,其實就是智能化製造設備的大數據,不過如果從數據量來說這些智能設備的控制和運行數據並不是多麼大的數據,但是這些數據相關的複雜度、處理的實時性絕對非常巨大的。其實這也是大數據另外一個面,就是不光海量的數據叫做大數據,數據相互關聯複雜多特別巨大的也叫做大數據。

在製造大數據的體系下,所有的生產設備都是智能化的設備,其每次的任務執行都核心控制系統調度控制的結果,那麼利用製造大數據可以做如下事情:設備精確控制、設備運行優化、設備故障預測、製造系統改進升級等。根據我目前的知識面,我就詳細聊一下設備精確控制這個話題。

在數字化控制的時代,製造設備運行是嚴格的精確位置運行控制,很簡單的例子就是數控機床,這個數字化得製造設備必須按照設定好的運行軌跡嚴格的運行和停放。

舉個例子來講,如果有這樣一個動作:將一個加工件打一個10mm的孔,那麼每次打孔機的初始狀態都要回到相對0位置,在進行了上萬次的重複操作後肯定會出現誤差,有可能初始位置回到相對-0.1mm或者 0.1mm,那麼就會出現大量的具有誤差的產品。在製造大數據控制體系內,控制系統對智能設備的控制不是起點和終點,而是智能設備的運行軌跡。

當然這個軌跡是根據機器學習控制演算法來實現的,可以將同一批次的、做同樣工作的智能設備每次的運行軌跡數據進行分析處理從而得到下一個時間段的準確的運行軌跡,換句話說智能設備可以根據機器學習自動修復在生產過程中產生的誤差。

從技術的角度來看製造大數據系統,需要有IOT、深度機器學習系統、智能控制演算法系統等來組成,IOT其實就是目前工業要進行的智能製造設備物聯網,如德國提出的CPS;深度機器學習系統目前國際上的幾大科技巨頭都將自己的深度機器學習平台進行了開源如Google的TensorFlow、微軟的DMTK、百度的DMLC等。

3、銷售大數據

最後咱們聊聊銷售大數據,關於銷售大數據我認為有兩層意思一個是基於大數據的精準行銷,另一個是基於大數據的精準需求分析。基於大數據的精準行銷其實大家可能都有所理解,在大家使用淘寶、京東等電商平台進行購物的時候在你的界面上都會有些推薦商品或者一些優惠套餐,其實這些都是根據你或者你這個地域、年齡段、性別等訊息進行全購物平台的相關數據分析的結果。

那麼大家想一想,在消費品行業可以進行如此精準的行銷,在工業領域也必然是可以的。而且由於工業採購往往是大宗、低頻的商業,在這個銷售過程中就可以基於大數據做一些供應鏈金融、電子期貨等等。

關於基於大數據的精確需求分析,我之前在飛機上經常看到一個IBM大數據的廣告,講的是如何利用大數據分析迅速的獲取滑雪愛好者的需求,然後生產出符合最符合當前客戶需求的滑雪板,最後成功的賣給滑雪愛好者並得到極大的好評。

其實這就是一個很好的案例詮釋銷售大數據的意義,通過銷售大數據的分析可以更好的瞭解市場需要和預期,進而指導產品設計和生產。從技術的角度來看銷售大數據系統,我覺得和供應大數據系統比較類似,同樣需要需要由網際網路爬蟲系統、流數據處理系統、數據可視化系統四個主要的核心系統來構成,不過對於工業的銷售大數據系統來說流數據處理可以根據需求替換成數據倉庫分析處理系統。

結語

大數據時代和工業4.0時代同時達到一個爆發期,這可以看作兩化融合的最高階狀態。我們可以相信和憧憬,在這個數據與工業4.0充分融合的時代會給人類帶來有史以來最大一次的生產力提高和解放。大數據和工業4.0融合的時代,這是個最好的時代。

從 3 個角度來分析為何我們需要自動化行銷

Gamma Pack