每周三期,详解人工智能产业解决方案,让AI离你更近一步。
成都创新互联专注于资溪企业网站建设,成都响应式网站建设公司,商城网站建设。资溪网站建设公司,为资溪等地区提供建站服务。全流程按需定制开发,专业设计,全程项目跟踪,成都创新互联专业和态度为您提供的服务
解决方案均选自机器之心Pro行业数据库。
方案1:全球人口分布地图和密度系统
解决方案简介:
该系统利用深度学习分析卫星图像数据,目标是打造全球人口分布的地图,以此指导公司的无人机项目,帮助更多的人接入互联网。以相对较少的照片(约 8,000 张在印度上空拍摄的图片)的信息训练其模型,训练得到的神经网络能鉴别出拍摄自其它 20 个国家的照片中人类生活的证据。
解决方案详解:
目前,该系统已总共分析了代表 2,160 万平方千米地球土地的 1,560 万张图片。识别人造物的错误率低于 10%。之后打算再结合其它数据,生成准确的人口密度系统。
项目由 Facebook 工程师兼光学物理学家Tobias Tiecke 及 Facebook Connectivity Lab 负责人 Yael Maguire 牵头。
研究者仅简单判断样本照片中是否有人居住并进行标注,将标注后的图训练神经网络,只在「是与否」之间进行简单的二选一,而不用标注房屋、汽车等人造物证据。训练结束后,能得到一个简单的分类器(Classifier),此时该系统被部署,它自动分析地表的卫星图像,判断图像中是否有人造物地痕迹,再结合普查等数据进行分析,最终能生成较为准确的人口密度图。
方案2:大数据清理软件服务
解决方案简介:
自动进行数据清理的数据转换平台,可创建可供多个不同平台(传统的关系式数据库、Hadoop 集群)使用的接口。Trifacta 可以创建可在多个实体数据存储及处理系统上运行的 SQL 查询或 map reduce 代码。
该平台是在底层设计时考虑到用户的体验,提供的服务能让数据科学家从数据净化的脏累活中解脱出来,让数据分析师能专注于数据的处理,而无需开发复杂的管道去清理数据和把它们放入数据仓库。是第一家是将后端数据技术与直观的前端用户可视化界面成功结合起来的大数据公司。
解决方案详解:
从大数据集中自动化采样数据,使用可视化的方式让分析师在很短的时间发现有趣的模式。
应用机器学习算法为重新组织信息和整理提供建议。分析师可以将数据集分组为信息的逻辑部分,每次将其规范化,并在其工作过程中以友好的界面方式显示。归纳概括整个数据集合是最后一个步骤,这将最终形成半结构化的数据集并最终成形。
Trifacta 有超过 50 个企业用户,其中包括思科、运动相机厂商 GoPro、Juniper、医疗保健系统集保险公司 Kaiser Permanente、供给、信息和保健管理产品及服务供应商麦克森(McKesson)、百事公司、辉瑞制药公司( Pfizer)和宝洁公司等知名大公司。Trifacta 的收费标准是按机构的数据体量计算的,费用从 10 万美元到 15 万美元不等。
2015 年 10 月份,Trifacta 还推出了一款免费的简化版大数据清理软件,这款免费软件目前拥有超过 5,000 个用户,遍布全球 105 个国家的 3,000 家公司里。
方案3:智能试衣间
解决方案简介:
智能试衣间通过带触摸屏的镜子及灯光调整,帮助用户找到适合自己尺码、颜色和消费场景的服装。主要希望通过智能化的手段和亲身体验效果,来提升线下实体店服务的体验,创建线下服务相对于线上电商的差异化竞争力。
解决方案详解:
消费者进入商店,通过镜子浏览店铺中所有商品,提交试穿申请,衣服就会被导购员摆放在试衣间。顾客可以调整灯光亮度和颜色模拟使用场景,镜子感应衣服上的 RFID 标签并显示在屏幕上,然后镜子给出搭配建议。
如果需要试其他颜色或尺码的衣服,也能通过屏幕下指令,让导购员送来。
当顾客试穿满意后,可以直接在镜子上通过 Paypal 付款,试穿过的衣服会保存在个人账户中。试衣间里还安装了 Kinect,可以记录追踪试衣者的动作。
方案4:恶意软件防范软件—CylancePROTECT 系列
解决方案简介:
现有的网络威胁旨在绕开已有的保护措施,而简单的事后检测难以保障安全。该公司利用数学模型为每个文件给出其风险因素,基于该风险因素,通过机器学习算法辨别「好」文件与「坏」文件。使用可扩展的大数据架构,从中识别文件模式。
解决方案适用于不同行业,比如关键基础设施、教育、能源、金融、健康、零售、联邦政府等。
解决方案详解:
机器学习共需要四阶段过程:收集、提取、学习和分类。
1. 学习利用各行业的涵盖各种格式、作者的文件进行手动训练,文件被分成已知且验证有效、已知且验证恶意、未知三部分,这些文件的分类需要保证正确,否则会带来偏差;
2. 提取利用机器的计算能力和数据处理技术来识别文件的最有可能的特征集。 根据其文件类型(.exe、.dll、.com、.pdf、.java、.doc、.xls、.ppt等)提取文件的唯一特征。消除手动分类的偏差。使用成千上万个特征来确定恶意文件,这大大提升了恶意软件制作者的成本;
3. 学习属性被搜集,归一化后,利用矢量化和机器学习排除其中不甚相干的特征,以加快分析速度,数学家根据分类效果建立统计模型,计算每个文件风险因素;
4. 分类基于统计模型得到的文件风险因素对其进行判断,对文件所属的用户得到可信度的分析,实现优化。
方案5:数据建模平台——DataBrain
解决方案简介:
DataBrain 数据建模平台包含了机器学习技术,根据其数据分析服务体系,建立了数据科学工作流,帮助数据分析师、数据工程师、业务分析师提升建模能力。
平台提供适用于信用风控、精准营销、个性化推荐、定投策略、客户分群等模型,可帮助银行、金融机构管理业务,提高运营效率。
解决方案详解:
DataBrain 数据分析体系共分以下七步:
1. 问题定义:选择适合用数据模型解决的问题,将特殊的业务问题转化为数据科学问题;
2. 数据准备:从多个数据源抽取关键数据,对关键数据进行清洗、处理和加工;
3. 算法调优:选择适用于特定数据的算法,自动寻找最优参数,建立高效率的数据模型;
4. 知识发现:将数据模型转化为决策依据,从数据中发现业务经验以外的新知识;
5. 效果分析:基于不同的效果衡量指标分析模型效果及计算效率,评估模型的业务价值;
6. 线上部署:规范模型输入输出+,让模型与业务系统无缝对接,从海量数据中自动学习;
7. 模型更新:监控模型稳定性、模型效果、模型逻辑与数据变化,收集反馈数据,持续更新模型。
而数据建模平台内置了自动化调参机器人 Atom,在建模时会去寻找不同算法对应的参数,找到最优的算法和参数组合,提高调参的效率,Atom 通过分布式计算,把调参数及挑算法的任务自动分发到多台计算节点上,大幅缩短计算时间,并实时监控模型效果并在线迭代。此外,平台还能从多个数据源自动提取数据特征,将数据分析结果转化为业务知识,为客户决策提供依据。