英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场

点击上方蓝字
关注我们
(本文阅读时间:15分钟)
大家好!我是爱吃、爱玩、更爱学习技术 , IT届的新晋网红 , 开发者的好朋友—比特熊!
《黑客帝国:矩阵重启》的观后感如何?
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

【英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场】虽然电影一言难尽 , 本熊还是被Neo和Trinity的爱情骗光了眼泪……
这一期比特熊终于请来了两位线下嘉宾—— 张丹、 李卓桓!两位老师共同的身份都是我们非常优秀的微软MVP , 还和比特熊一样都是“黑客帝国”迷 。
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

【比特熊故事汇】作为比特熊直播间的重要栏目 , 定期请来技术大牛和行业先锋做客 。 这里不仅讲最“热”的技术 , 还有更多待解锁的个人故事和趣味话题!请持续关注 , 更鼓励大家推荐你想认识的“英雄” 。 欢迎大家来到直播间 , 跟比特熊一起 , 与专家们零距离畅聊 。
张丹
●微软MVP - Data Platform
● R语言实践者
● 北京青萌数海科技有限公司CTO
著有:《R的极客理想:量化投资篇》《R的极客理想:工具篇》《R的极客理想:高级开发篇》
个人博客:http://fens.me
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

李卓桓
● 微软MVP - AI
● PreAngel 合伙人 , 创业导师
● 硅谷知名孵化器 Plug and Play China Venture Partner
著有:《Linux 网络编程》《Chatbot 从0到1》和《简明的 TensorFlow 2》
GitHub主页:https://github.com/huan
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

张丹:大家好 , 今天我要分享的是R语言在数据分析领域的贡献 。 很多互联网的朋友们可能不太熟悉R语言 , 和Python、Java、C相比它是一个小众语言 。 R语言非常特别 , 在各行各业的数据分析领域都有广泛应用 。
R语言是由统计学家发明的 , 所以它设计方向和语法结构和其它语言很不一样 。 这是R官方提供的一个任务列表 , 它解决的是贝叶斯的问题 , 还有数据库的问题、聚类的问题、生态的问题、环境的问题、金融的问题……因为现在数据科学和人工智能比较火的 , 所以R语言有大量的贡献在这个 Machine Learning 领域 。
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

R语言的核心社区是CRAN , 它是R语言核心团队维护的 , 我们用的所有的包基本上都在这个社区上 。 这个社区并不是维护所有的包 , 还有R-Forge , 它是从CRAN拓展出来的 , 还有 Bioconductor , 所有生物的包都在这个社区 。
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

比特熊:张丹老师给我们介绍了数据分析在中国的现状和落地机会 。
张丹:
1、数据分析在中国是一个非常大的新兴市场 , 积累了大量的数据 , 而且系统相对成熟 。
2、这个大数据技术 , 不管是Hadoop、Spark , 还是新的ClickHouse、PyFlink , 这些深度学习或者机器学习的技术都已经相对成熟 。
3、大家都认同数据是有价值的 , 要不然不会收集这么多数据 。
数据分析的各个方面都已经被认同了 , 大家都认为数据有价值 , 那数据价值是什么?这是第一个问题;第二个问题 , 怎么证明数据的价值?第三个问题是怎么证明你的价值 , 你怎么能发现这些价值?这其实就是数据分析领域要解决的核心问题 。
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

数据分析不同于传统的软件行业 , 也不同于互联网、咨询、运营分析、商业分析 , 我们理解的数据分析包括了两个部分:
1、数据的顶层设计 。 顶层设计包括我们对这个数据的业务需要理解 , 每个行业的业务是不一样的 , 比如说我们现在会帮助部委去做事 , 我们做海关 , 做外汇、做药监、做水利 , 其实都是不同的行业 。 只有理解业务 , 才能通过数据看出这个数据有什么特征 , 找到数据的关系 , 基于现在已有的工具去建模 , 把模型训练好 。
2、工程实践 。 工程实践就是跟现有的业务去连接 , 做开发、做集成、做落地 , 实际为业务去解决问题 , 这样才是数据分析的完整体系 。
最后介绍一下我们公司 , 我们主要做面向政府的数据分析 。 主要解决贸易犯罪、反洗钱、反欺诈等问题 , 同时还要落地 , 因为数据分析价值的体现就是帮助业务解决问题 。
李卓桓:这个时代有这么多的语言 , 迭代如此之快 , R语言还能屹立不倒一定是有非常大的魅力 。 我是AI方向的MVP , 我关心的领域是聊天对话机器人 , 或者我们叫对话式人机交互界面 。 通过这种方式 , 我们把过去所有的应用都能够用自然语言对话的方式实现 。 这里介绍一下两本书 , 第一本是我和佳芮写的《Chatbot从0到1》 。 这本书会告诉你基于产品经理角度怎样去做对话 , 怎样去设计一些更符合用户体验的对话来完成任务 。
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

另外一本是关于算法的 , 叫《简明的 TensorFlow 2》 , 如果想要对 TensorFlow 2有入门的了解 , 这本书是很好的 , 在网上我们有公开的一个版本 。
比特熊: 李卓桓老师先回顾了一下人工智能这些年的进展 。
李卓桓:
1、ImageNet 是一个典型的图片识别任务 , 10年前程序识别率不到70% , 2015年准确率超过了人类 。
2、2016年的时候 , AlphaGo 4 : 1击败李世乭 。
3、2017年 AlphaZero 诞生 。 Zero 的意思是说它在成长的过程中 , 没有学习任何人类的知识 , 而是通过规则自己领悟 , AlphaZero 和 AlphaGo 打起来的成绩是100:0 。
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

4、2018年 , OpenAI 在5v5的电竞中击败了人类的世界冠军队 。
5、有一个AI的评测叫 GLUE Benchmark , 有各种各样的任务 , 比如理解、填空等等 。 没错 , 2019年的时候AI在这个测试上超越了人类 。
6、2020年的时候 , 波士顿动力做出了会跳舞的机器人 , 当然从这些机器人的舞姿可以看出 , 已经骚到绝对不是只会跳舞那么简单 。 2020年还有一个震惊世界的自然语言模型 GPT-3 , 据说训练这个模型就花了1000万美元 。 它的能力是你给它起一个头 , 它就可以顺着往下写 。
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

7、Open AI也没有停下脚步 , 它在GPT-3的基础上增加了图像学习 , 说一个你想要的东西 , 程序能给你画出来 , 这个模型叫DALL-E 。
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

GPT-3既然有自然语言这么强的能力 , 所以微软把它集成到了GitHub里面 , 推出了一个叫CoPilot的产品 , 也就是结对编程 。 你的结对编程对象是一个人工智能的模型 , 图里所有灰的地方就是这个程序自动帮你补齐的 。 这个功能我已经用了三四个月 , 非常好用 , 现在我每天写的代码里面 , 有10%~20%是它自动帮我生成出来的 。
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

介绍这么多 , 是因为我自己是一个非常乐观的人工智能支持者 , 再过20年 , 算法和人工智能会变成什么样子 , 我觉得是非常值得期待的 。 回到交互上来 , 过去机器只能通过界面来和我们交互 , 包括写程序 , 未来交互的趋势一定是有智能无界面的 , 通过自然语言就可以 。
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

▲《黑客帝国4》中程序也能脱离母体来到现实世界
比特熊: 谢谢两位老师的技术分享 , 下面是比特熊故事汇必不可少的灵魂拷问:成为MVP故事!
李卓桓:加入微软MVP很机缘巧合 , 最早的时候是在一个女性开发者节上遇到Chris(是的 , 我去参加了女性开发者的活动 , 哈哈哈哈哈) , 我们就着人工智能、开发者社区聊了很多 。 Chris 给我介绍了整个MVP的概念……后来特别荣幸 , 那一年不单是我 , 我们 WeChaty 社区里面有四、五位开发者分别申请了不同领域的MVP , 所以那次活动真的是 WeChaty 和MVP非常有缘分的一次相聚 。
比特熊: 女性开发人的队伍也是越来越壮大 。 非常巧合的契机 , 让又一批优秀的开发人们加入到了微软MVP大家庭 。 听说张丹老师成为我们微软MVP也已经有5年的时间了 。
张丹:是的 , 四五年前用R语言的人比现在要少 , 后来统计分析带动了一波R 。 那个时候我还在银行 , 就有时间参加社区活动 , 刚好认识了Chris加入了MVP , 我印象深刻的故事其实是加入MVP以后 。
开始我觉得我们大家都不在一起 , 只是每年聚聚 , 没什么感觉 。 直到我参加了微软每年3月组织的全球MVP去西雅图总部的活动 , 才彻底融入了MVP群体 。 刚到西雅图的时候很兴奋 , 一切都很新 , 特别有意思 。 第一次去西雅图很认真地听每一节课 , 做好课堂笔记 , 向Chris汇报 。 第二次去我们就听我们喜欢的、感兴趣的新领域 , 其他的时间我们悄悄的把西雅图周边玩了遍 。
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

李卓桓:当时我还去拜访了李小龙的墓 。
张丹:也希望大家有机会可以来报名 , 壮大我们的组织 , 一起做有意思的事情 。
李卓桓:我补充一下这个活动叫 MVP Summit , 每年微软会邀请全球一共应该是有2000位左右MVP , 最后到西雅图的大概有400~800人 , 来自全球各个领域的开发者、专家 。 我们会有三天各种各样的活动 , 白天的活动都是微软的各个开发部门的负责人告诉我们他们要发布的产品——所有MVP和微软都要签NDA(保密协议) , 我们会在发布正式发布之前拿到一些信息 。
张丹:因为疫情 , 现在我们都搞线上的虚拟大会了 。
比特熊:希望很快能有机会再次举办这样盛大的活 , 比特熊也好想参加 , 我想报名成为志愿者 。
我们这次的直播平台还有一个是《环球银幕》 , 比特熊直播间也一直和《环球银幕》有不少联名和互动 , 我们希望让大家不仅是技术上有进步 , 艺术方面也有所收获 , 比特熊可是十分关心各位的全方面发展 。 希望两位老师跟大家分享一下自己平时的爱好 , 比如说喜欢看什么样的电影 , 还有和技术的联想~
张丹:我比较喜欢看的还是科幻片 , 一直对科幻抱有畅想 , 小时候最喜欢的电影是《独立日》 , 1996年的片子 , 印象很深刻 。
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

▲《独立日》开启了好莱坞科幻/灾难大片的新模式
后来还有《阿凡达》 , 它的IMAX 3D效果非常震撼 , 也永远改变了电影行业 。
比特熊:《阿凡达2:水之道》今年年底终于要上映了!
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

张丹:再后面是“黑客帝国”系列 , 虽然《黑客帝国》很早就出来了 , 但是发现小时候没看懂 , 到现在“黑客帝国”三部曲已经看了4遍了 , 才大概明白原来是讲了这样的一个故事 。
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

我还喜欢打游戏 , 以前不怎么打 , 后来发现游戏真是越做越好 , 尤其是现在的单机大作 。 除了休闲 , 我们还可以从游戏里掌握很多规律 , 比如说城市建造类的 , 或者星球探索类的 。 像《我的世界》这种真正的沙盒游戏 , 开放性很强 , 很容易把我们的现实带到游戏里 , 也可以把游戏里的东西带到现实里 , 其实是做一个双向的东西 。 因为我们精力有限 , 不可能各个行业都精通 , 有些知识来自于游戏互动 , 或者是未来的元宇宙 , 都很令人期待 。
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

▲《我的世界》也要搬来Azure了
李卓桓:我喜欢的电影里面有部和张老师一样的 , 那就是《黑客帝国》 。 最近《黑客帝国4》刚出 , 我们也准备去看 。 元宇宙这个名词现在这么火 , 我觉得完全没有必要 , 这部二十年前的大作 , 就有一个大家都熟知的典型的元宇宙“母体” , 它把这个概念、这个题材已经拍到完美了 。
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

比特熊:确实是无法超越的经典 , 本熊刚刚看了《黑客帝国:矩阵重启》 , 感想很多 , 它一方面饱含导演被好莱坞“逼迫”拍摄续集的无奈 , 一方面又暗合了经典已逝的当代语境 。
李卓桓:不过我喜欢这个系列不是因为“元宇宙” , 而是它里面的程序能够和人自由交互的设定 。
比特熊:动画版《黑客帝国》中出现了矩阵之外 , 有自我意识的机器人愿意与人类和平相处的情节 , 这点在《黑客帝国4:矩阵重启》也有出现 , 本熊就不剧透了哈哈哈 。
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

李卓桓:除了《黑客帝国》 , 还有一个电影我觉得是对这个行业——聊天对话机器人 , 或者说从业者或者说所有人 , 有一个启蒙效果:《她》 。 这部电影大家应该都看过了 , 就是《失控玩家》不敢做的事:人类和AI语音助手的爱情故事 。
比特熊:是的 , 比特熊对主人公常穿的红色外套印象深刻 , 这抹亮色让他即使穿梭在人群中也十分显眼 。 比特熊与环球银幕联名合作的包包上也选用了《她》的主人公经典的红色外套形象 。
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

李卓桓:我觉得聊天的魅力在于它不需要任何特效 , 我们有时会忘记纯粹的对话所包含的能量 , 文字所能承载的情感 。 大部分人应该都有这种体验 , 看小说会有不同的感受 , 从文字里获得的想象 , 可能不比电影呈现的特效差 , 这也是“原著党”永远得不到满足的原因之一 。
比特熊:卓桓老师说到文字有时信息量更大 , 这种“去视觉化”的输出 , 减少了具象的呈现反而更有想象和表达的空间 , 能抵达更深层次的内容 , 引发思考 。 比特熊也想自夸一句 , 虽然直播很精彩 , 但是我们每一期英雄故事的总结文章不只是直播内容复刻 , 还加入了文字表达的优势 。
我们12月的MVP英雄故事:《 年末技术VS休闲实用帖 , 相约璀璨2022 》 , 在发布以后获得了很多关注 , 比特熊也收到了很多小伙伴的私信 , 表示很喜欢我们这部分内容 。 请继续关注微软MSDN公众号和微博 , 还有思否和CSDN平台 , 以及比特熊自己的个熊微信号(BitsBear) , 我会持续输出好内容 , 与各位技术爱好者和粉丝们无障碍交流 。
比特熊有话说
本期 , 比特熊携手Global AI Bootcamp为技术爱好者和粉丝们带来一场既专业又个性十足的走心直播 。 李卓桓和张丹老师来到【比特熊直播间】现场也是久违的嘉宾完整体线下加入 , 整场直播不仅是思维碰撞也是气场交流 。 李卓桓老师一直在Conversational AI方向不断探索 , 为我们分享了大家都十分感兴趣的聊天机器人 。 经典笑话和具象的漫画与【比特熊故事汇】“有趣地谈技术”风格很搭 。 “创新”、“突破”和“可能性”这几个关键词在他身上展现地淋漓尽致 。 张丹老师在R语言和数据方面 , 从“源起”开讲 , “实用场景落地”结尾 。 正如 , 他所在的行业和工作内容 , “稳定”、“精准”和“安全性”是我们迅速捕捉到的特性 。 另外 , 不少直播间的忠实观众也反映 , 张丹老师如播音主持的声音和语速 , 感官输出了他的个人风格 。
两位老师 , 其实在技术长项上是有所差别的 。 在真直播和我们的线下交流中 , 两位无论是在专业领域 , 还是兴趣爱好中都展开了“有益”对话 。 张丹老师会通过打游戏的方式缓解工作压力 , 李卓桓老师挑战极限运动 , 比特熊羡慕之余 , 也产生了“试一试”的想法 。 希望本次直播 , 能给技术爱好者们带来的不仅是技术干货 , 更多的是对已知领域的思考和对未知世界的期待 。
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

2022年首场【比特熊故事汇】MVP英雄故事如约加入新一年的“成长”升级 。 最近 , 比特熊通过各种活动和直播认识了更多新伙伴 。 大家也为比特熊贡献了不少“好主意” 。 比特熊都有收到 , 正在通过自己充满智慧的大脑袋吸收和消化 。 请大家持续关注【比特熊直播间】和“熊”出没的各种场景 , 期待我的进步和输出吧!提前祝大家新年快乐 , 虎虎生威!春节过后的【比特熊直播间】又会玩出什么新花样?锁定我的频道 , 精彩即将到来!
英雄|【比特熊故事汇】1月MVP英雄故事|R语言实践者与人工智能探险家的华丽开场
文章图片

【比特熊粉丝后援会】
与开发者一起嗨聊 , 期待成为你的好友~
???????????????
点击回看直播

    推荐阅读