2014-07-14  NCW  
 

 

數據挖掘成為阿里巴巴未來的工作重點,更大的理想是建一個數據共享平台,阿

裡數據變現才剛剛開始

◎ 財新記者 李小曉 文lixiaoxiao.blog.caixin.com 7月8日,阿里雲計算最重要的一款產品——ODPS 正式開放商用。簡單來說,ODPS(Open Data Processing Service)是一項 Web 服務,大家不用花大錢建數據中心,就能分析海量數據。按照阿里雲測試,100PB 的數據任務可在六個小時內跑完,這個數據量相當於1億部高清電影。

如何讓數據產生價值?阿里雲公開信中說,先得擁有大規模處理能力,然後才是挖掘、算法和分析。

ODPS 之前一直在阿里內部試用。

第一個「小白鼠」是阿里小貸。阿里小貸每天處理30PB 數據,包括店舖等級、收藏、評價等800億個信息項,運算100 多個數據模型。目前,阿里小貸每筆貸款成本0.3元,幾乎是普通銀行貸款成本的千分之一。

中國科學院院士鄂維南認為,信貸審批最終一定要借助大數據。 「風控測算肯定要用大數據,如果規模大的話,人工逐個審批效率太低。 」阿里雲方面表示, 「ODPS 任何人都可以來用,設定好一套參數,擰開 水龍頭流出來的就是『果汁』 ,隨著原始數據和算法的改變可以千變萬化。 」眼下,阿里巴巴各項數據業務都在用ODPS「榨果汁」 。

阿里巴巴創始人馬雲曾在多個場合表示,數據挖掘是阿里巴巴未來的工作重點。如今看來,阿里數據的變現才剛剛開始。

線上小貸風控

阿里巴巴最初成立小貸公司可追溯到2010年,如今已經在阿里巴巴、淘寶(含天貓)和速賣通三個平台開展信用貸款。目前阿里貸款和淘寶貸款是純信用貸款,不需要任何抵押或擔保,授信完全是靠大數據自動審批。

阿里小微信貸利用其阿里巴巴、淘寶、支付寶等電子商務平台上客戶積累的信用數據及行為數據,引入網絡數據模型和在線資信調查模式,將客戶在電子商務網絡平台上的行為數據映射為企業和個人的信用評價。其中,小微企業大量數據的運算依賴於互聯網雲計算技術,判斷買家和賣家之間是否有關聯,是否炒作信用,風險的概率的大小、交易集中度等,從而把握貸款的安全性。

「阿里小貸風控數據100% 來自淘內數據。 」 阿里小微金服微貸事業部總經理婁建勳表示。

目前,阿里貸款和淘寶貸款其背後的出資者均為阿里小貸公司。阿里小貸公司共有三家,其中重慶兩家,浙江一家,近年來大股東不斷增加投資,根據最新數據,目前資本金總計18億元。

阿里小貸業務於2012年底開始實現盈利,其中成本主要包括資金成本、運營成本、稅務成本、風險成本等。

婁建勳表示,在阿里小貸的風控中,大數據是核。近年來,風控的升級就是不斷在其中加入新的模型。目前有70多人專職做模型,在模型的基礎上,發放貸款全部由機器自動審批。

據財新記者瞭解,目前阿里各種小微信貸產品的平均壞賬率為1.3%。

目前,阿里風控使用的模型多達幾百種,包括防欺詐、市場分析、信用體系、創新研究等多種用途。阿里相關人士向財新記者介紹了兩個主要風控使用的探索類模型,即滴灌模型和水文模型。

滴灌是現在最先進的農業灌溉技術,可以把養分和水以最優的方式給到植物以獲得最大的受益。 「阿里微貸事業部希望通過該模型的輸出,把資金分配給真正需要扶持的誠信賣家。 」阿里相關人士介紹。

滴灌模型基於賣家成長概率模型和賣家生存概率模型,通過這兩個模型的結果交叉對比,對每家店舖做出一個長期生存和短期發展綜合的評價。 「例如某家店舖最近促銷力度很強,利潤率很低,那在賣家成長模型的評價結果可能是,這家店舖短期成長速度可期但長期生存有憂。此外,成長模型還能指出這家店舖具體是在哪個經營維度太過激進需要調整,或是哪些運營方面應該持續改進。阿里金融會利用成長模型的輸出結果,給出具體的扶持計劃和資金支持。 」阿里相關人士表示。

水文模型亦是阿里小貸從2012年開始使用的風控模型,通過預判店舖未來經營情況來對客戶的資金需求進行判斷。 「舉例來說,在每年7月到8月是很多店舖的銷售低谷,傳統的信貸投放會在此時收緊,但實際上客戶這個時候會為了年底的旺季進行大規模的採購備貨,融資需求比較大。水文模型通過預 知這種趨勢,那麼就可以指導我們對店舖進行提前的信貸投放。 」阿里相關人士表示。

通過大數據模型的不斷完善,阿里小貸發展迅速。2012年初,淘寶和天貓信用貸款的准入客戶量控制在三四十萬戶,2013年使用滴灌模型以後,准入客戶開放到了300多萬戶。 「有了模型作為支撐,客戶可以不斷向下,現在哪怕只開了兩三個月,只有幾顆心的店舖,也可以獲得授信。 」阿里相關人士表示。

阿里小貸的模式在金融界也引發了很大關注,各大傳統銀行也紛紛試圖利用大數據實現業務轉型。今年1月,中信銀行聯合銀聯商務共同推出「POS 商戶網絡貸款」業務,依託銀聯大數據,自動批貸,為商戶提供50萬元以內的短期信用貸款。其背後大數據的來源是銀聯商戶的POS機流水等記錄。

面對銀行的挑戰,阿里相關人士表示「和阿里沒法比」 。 「銀行的數據雖龐 大,但維度遠沒有阿里多,只包含消費的金額和地點,卻沒有商品的信息等。 」儘管阿里方面充滿自信,銀行業內人士則認為,在利用大數據做信用貸款方面,雖然銀行的數據資源並無優勢,但銀行的資金具有絕對優勢。阿里小貸靠自有資金放貸,和銀行的資金體量相去甚遠,其業務模式和貸款額度必然受到限制。

「未來系」 應用

眾所周知,Google 將世界盃往屆數據在 BigQuery 上跑了跑,成功預測了本屆世界盃八強名單。一下子,Google火了,大數據也火了。

阿里的 ODPS 正是一款跟 Google BigQuery 類似的產品。 「如果哪位有數據,也可以來算一算接下來的比賽。 」阿里人士稱。

每當財新記者問到阿里大數據未來的應用,受訪的阿里人都能將基因檢測 到羽絨服製造嵌入大數據這個「效率加速器」 。

鄂維南對財新記者表示,這個社會中有很多浪費:時間、金錢、效率。大數據本身並不能帶來直接效益,但它可以消除浪費。阿里大數據的變現也正是沿著該思路。

2013年,阿里邀請華大基因在ODPS 上測試了基因測序,耗時不到傳統方式的十分之一。 「一旦未來真有生物危機爆發,人類可以贏得寶貴的破譯時間。 」阿里雲公開信表示。

2014年5月底,支付寶發佈了「未來醫院」計劃,目前已經在廣州婦女兒童醫療中心試運行。該項目希望將社保、病歷、檢查報告等數據都納入健康檔案,還將引入高德室內地圖的導航功能。在藥品監控方面,未來每盒藥品上都有一張電子身份證,從生產、流通、儲存、配送、銷售到使用,全過程的數據都跑在ODPS上,一旦發現問題藥品,監管部門可以立即採取措施。

阿里利用大數據打造的「未來系」產品還包括「未來公交」 。該項目旨在讓用戶把手機變成一張通行全國35個城市的公交卡。支付寶錢包表示,從長期看,隨著雲計算和大數據等能力的接入,「未來公交」對積累的用戶數據進行雲分析後,公交部門可以提升線路設置的科學性,大幅提升運力,減少某些線路「擠死」 ,某些線路「空死」的情形。

支付寶錢包目前也在嘗試和中石油、中石化合作,將商品和加油站綁定,可以在加油時提取商品,節省快遞費用。

這背後所蘊含的大數據應用是分析用戶的加油習慣和日常生活需求。

2014年5月27日,中國氣象局公共氣象服務中心與阿里雲達成戰略合作,海量氣象數據將通過阿里雲計算平台,變成可實時分析應用的「活數據」 。公共氣象服務中心計劃深度挖掘利用的數據包括: 60多年來的歷史氣象數據 ;全國2萬多個觀測站、衛星、雷達監測的氣象觀測數據,包括降水、溫度、風力風向、地面結冰、太陽輻射、酸雨、空氣能見度等30餘種要素 ;短期、中期、長期的精細化氣象預報數據;通過國際交換獲取的全球氣象觀測、預報數據。

阿里已經將中國氣象局的數據嵌入阿里來往、旺旺、支付寶錢包、高德地圖等產品,多渠道傳播氣象等災害預警信息。據悉,阿里還將參考氣象局數據,指導季節性服裝生產等。

惠及參股企業

阿里近兩年來「多點開花」的投資步伐廣為人知。自2013年至今,阿里已經投資了包括高德地圖、UC 瀏覽器、恆大足球、新加坡郵政、優酷土豆、新浪微博、銀泰集團、文化中國、恆生電子、華數傳媒等眾多不同領域的企業。

一旦被納入阿里生態圈,這些企業也將或多或少受到阿里大數據思路的感染。這些企業不僅和阿里之間展開了數據互換,企業之間也在交叉合作。

據高德軟件有限公司LBI 產品負責 人逄金龍介紹,目前高德和阿里數據平台部門、BI 部門、廣告部門、O2O 部門展開了合作,探討怎樣把地理的內容進一步落地。同時,高德也在和銀泰網等其他機構在談怎麼樣能夠讓地理價值更好地發揮出來。阿里雲公開信中舉例道,結合中國氣象局的預報數據,高德地圖不久後就能告訴你: 「前方道路已嚴重積水,您的車輛駛入可能會遭水淹,建議繞道行駛。 」阿里和快的打車的合作廣為人知,去年快的打車和滴滴打車曾經一度掀起價格戰,給司機和用戶不惜血本現金返利。而在促銷活動白熱化的同時,利用活動作弊套利的現象也層出不窮。例如可以點擊「叫車」 ,輸入「我已上車」 ,之後不斷輸入,僅付0.1元,套取剩餘返利。而阿里如今的防作弊手段和阿里小貸的風控手段類似,也是借助大數據和資金鏈的關係,用模型識別不正常的行為,從而動態防控。

阿里和UC 發佈「神馬搜索」也是雙方在大數據領域的合作。在對外發佈的新聞稿中,UC 稱阿里基於電商、雲計算、大數據方面的能力與 UC 在無線互聯網方面的積累碰撞,將給整個行業帶來無盡的想像力。

6月12日,阿里巴巴與中國郵政宣佈戰略合作,阿里巴巴董事局主席、菜鳥網絡董事長馬雲表示,這次合作正是要通過互聯網手段,以大數據為技術底層,重新定義郵政和物流的新模式。據中國郵政總經理李國華介紹,下一步,中國郵政廣泛的網點佈局將與阿里巴巴的電商大數據充分結合,未來可以通過雙方平台的對接,為線上商品提供網點網絡訂購、自提、配送等服務,將網購下沉到三四線縣市和農村市場。

在阿里和銀泰的合作中,阿里希望把銀泰的實體店電子化、進行會員賬號的打通,雙方還可以基於用戶大數據進行消費行為分析,挖掘新的商業價值。

銀泰和阿里3月宣佈已經建立了1000個商品的數據庫,但銀泰方面向財新記者解釋,數據庫還在非常初級的層面,還沒能實現線上線下庫存的打通。

這般例子一言難盡。阿里相關人士表示,阿里大數據的應用可以分為預 測經營活動、產品創新(結合天氣數據豐富保險產品,智能推薦旅遊線路等) 、精準營銷、科學生產(尤其是農業領域) 、高效物流、專業預測等。其中專業預測包括飲料銷量指數、羽絨服銷量預測、針織衫銷量預測、空氣淨化器銷量預測、洗車市場預測、太陽能發電預測、居民用電量預測、農產品生產情況預測、災害預測、航班延誤預測、工程工期預測等。

此外,阿里申請個人徵信牌照一事也成為坊間周知的新聞。一旦阿里獲得個人徵信牌照,其積累的海量用戶數據將被製作成徵信產品,提供給成千上萬的賣家。

阿里更大的理想是建一個數據共享平台。業內人士猜測,這個共享平台可能用於阿里上下游企業,以及阿里投資的子公司企業。更大膽的猜測,也許有一天阿里會把數據做成產品,供全社會購買使用。