当前位置:首页

【字体:放大 正常 缩小】 【双击鼠标左键自动滚屏】

登录日期:2017-06-01 【编辑录入:fengfy】 文章出处: 《文汇报》2017年5月31日度3版

让数据带着感情奔跑
作者:#文汇报顾一琼  阅读次数:6186

宁绍军(中)与团队同事讨论,为海量数据设立“图关联”,建立“画像库”

宁绍军(中)与团队同事讨论,为海量数据设立“图关联”,建立“画像库”

 

    烧脑时,手边有没有咖啡都没关系;夏天外出,一件T恤包打天下,最好还带有公司LOGO,免得“日日上新”;加班到再晚,一碗泡面就能把三两句怨言全都压回肚子里……旁人眼里,宁绍军就是一个360度无死角对生活“无感”的工科男。唯独一桩事情例外:数据分析。这位来自于多子女家庭的“80后”,把生平少有的一次任性用在了学科选择上:“嫌弃”船舶设计专业太过呆板,纵身一跃,跃入彼时已然是红海的“计算机应用技术”。

    “无感”的工科男,加上“红海”专业,本应直接敲上“悲催”二字,封印存档。然而,世事难料。一个劲在“红海”闷头游泳的宁绍军突然发现,自己靠近了一片暗藏着的“无人区”:大数据分析。于是,当同行嗟叹时运不济时,这位大数据工程师头一抬,咧嘴一笑:“机会来了!”

 

    让数据多开口说话,在它们身上“寻宝”

 

    何谓大数据分析?

    宁绍军竟直接套用了“采矿挖煤”的流程:采集、挖掘、清洗、传输流通、输出使用……“原理和挖煤是一样的,只是处理对象是数据信息,处理方式也更高级些”。宁绍军目前就职的晶赞科技,是一家成立于2011年的年轻公司,短短数年已坐上国内大数据分析领域的头把交椅,也成为上海大数据交易中心的扛鼎成员、后台智库,客户遍布全球。作为该公司“开朝元老”,宁绍军领衔着大数据研发团队,说白了,就是尽可能让数据多开口说话,在数据身上“寻宝”。

    每天,仅通过移动设备汇集到晶赞的各类数据就有70亿-80亿条,每天能观察的用户数量超过3亿,而且每条数据都是由一串32位数的加密串码构成,研发团队的任务:要为这些海量数据设立“图关联”,建立“画像库”。

    打个比方,我们一天内会产生很多行为:所打的电话是通过手机号码来认证识别的;出门办业务,是通过身份证号来识别的;使用微信付款,是通过微信号内部的一个ID串码来识别的……不同的ID数据需要通过后台的识别、关联,才能找出相互之间的关联度,并逐渐汇聚到一个自然人身上。

    “数据会说话,当然还带有感情!”这是这位工科男引以自豪的发现。

    别人看了足以犯“密恐症”的数据,在他这里被咀嚼得津津有味。也只有在这个时刻,体内的多巴胺分泌到顶峰:“感觉自己就是一位心理专家或推理能手”。

    他说,当越来越多的数据汇聚到一个自然人身上,一副关于自然个体的“画像”就会渐渐丰满起来。“你慢慢就能看出他的行为习惯、兴趣爱好乃至即时的情感。”

    比如,“代码A”每天上班前总要光顾某家咖啡店,在店内无线网络状态下,他每次浏览手机内的公益广告时,屏幕滞留时间变长,就此可以大致推断:A君是位热心肠的暖男。“代码B”近期深夜喊外卖到办公楼的频率变高,还会在楼下便利店消费一点儿小酒,可知他一定“深深地疲累”,还带着那么点小沮丧。

 

    让大数据应用进社会管理中

 

    你知道么?目前有80%的旅游订单是在手机上完成的;70%有关汽车的各类信息是在手机上完成浏览的;而所有电商的订单下单高峰都很相似:上下班路上、午餐时间,以及晚上睡前。

    当越来越多的“自然人数据图谱”开始建立,大数据分析将挖出更多的潜藏信息,不同群体之间的行为习惯和分布也清晰可见。比如,宁绍军的研发团队就接手着全球最大快餐连锁品牌(A公司)的数据管理和分析业务。A公司的用户达数亿级别,信息来源有20多种,来自于自身APP、微信公众号、快捷支付渠道、门店WIFI数据、广告数据等等。

    依靠晶赞自主研发的大数据聚合产品,这些原本分散在不同供应商处的数据被有效聚合,数据关联被打通,有了可以跨维度进行大数据分析的基础。多重比对下,影响客户购买产品的最主要因素跃然眼前:天气。以温度为衡量,当高气温时,气温每增加一个单位,客单价格就会增加近2元;低气温时,气温每降低一个单位,客单价格增加0.7元。

    这样的分析,为该公司的仓储及门店备货提供了最直观的指导。

    “商业价值,这只是大数据的‘入门版’,其‘进阶版’在于应用进社会管理中。”

    去年,宁绍军率研发团队收集了上海出租车行业半年来的数据,经过分析发现:习惯拉短途的司机收入明显要高于那些习惯拉长途的司机。

    大数据分析中,同样以出车时长21小时为比较,拉长途的司机每天接单18单,平均单价47元,行驶里程468公里,空载时间为12小时;而拉短途的司机每天接单56单,平均单价22元,行驶里程400公里,空载时间7小时。综合下来,拉长途的司机平均一天可以挣850元,而短途司机一天可挣1240元。

    “希望这样的数据可以好好给那些习惯挑客、一心想着接大单的司机洗洗脑”。

 

    让数据分析更为精确,也让数据更精准地表述自己

 

    每天一早,宁绍军总是最早到办公室,迅速上网搜阅国内外相关技术性资料和文章,探寻最新的数据处理方式。

    办公室的落地窗外,高架上的车流穿梭不息,在他眼中,这和每天涌入系统的海量大数据并无二致。“我们更像一个数据的终端加工工厂,不仅要让数据有序顺畅得流动起来,更要让它们带着感情奔跑。”

    作为大数据工程师,不仅要帮助设立数据的提取模式,翻译数据知识库,寻找数据的新标签,更需要在“清洗数据”这一环,实现数据规则生成并反复验证,过滤掉那些无效、甚至恶意的数据,让数据分析更为精确,也让数据更精准地表述自己的情感,反哺、温暖每一个人。这位工科男开始描摹他脑海中的理想状态:周日,当你携家带口来到某商圈,手机上立刻推送出最佳的停车位置,并主动为您规划了商圈内的活动路径,各类演出、推荐午餐点也纷纷向你“招手”,甚至,它还知道你是否携带婴儿,并提示商圈内婴儿所需的各类服务点……

    事实上,这幅场景正一点一点实现。参与静安南京西路智慧商圈建设的晶赞已掌握了商圈客户来源、品牌关注、消费偏好等数据,这些都将很快转化为商圈人性化关怀的温度。

    伴随着国内大数据行业的崛起,近两年晶赞的营收增长每年都超过100%,有关大数据的专利数百项。“前几年大家对于大数据更多的处于一个想象的阶段,现在到了落地阶段,有了更多机会、更多平台,让有关大数据的想法落地,该是我们大数据工程师发力的时候了。”

 

 

 

荐稿人:ffy  执行编辑:zjy 2017-06-01  责任编辑:xwf 2017-06-01

1
 

上一篇工匠聂凤
下一篇三位老师十七个孩子

相关评论: (评论内容只代表网友观点,与本站立场无关!)
  • 暂无评论
发表评论:

验证码: