变身“圣诞老人”400岁比利时撒尿小童雕像可爱吸睛

中新网12月25日电 据“中央社”报道,欧洲本周迎来圣诞假期,已有400年历史的比利时布鲁塞尔知名景点“撒尿小童”雕像,也于当地时间24日一早应景变身为圣诞老人,吸引许多游客关注。

报道称,圣诞节,是欧美最重要节日之一。布鲁塞尔知名地标“撒尿小童”雕像24日变身为圣诞老人与大家一起过节,全身红衣、红帽、白胡子,模样非常可爱。

由此可见,担任 AAAI 2021 大会主席,也是顺理成章之事。

因此我们断定在定义问题的环节很难引入自动化,但是后面的环节,例如数据的收集、数据聚合,然后形成特征工程,包括模型的训练其实都是可以自动化。

机器学习的整个流程包括问题的定义、收集数据、建立特征工程、模型的训练和测试、应用,最后再将应用的结果反馈到第一步。所以这个循环的过程非常繁杂,有很多的环节需要人工智能的专家,这也是为什么一个人工智能落地的项目非常昂贵的原因。所以哪个步骤可以用自动化来解决?例如从定义问题出发,定义问题不仅仅是从过去知识学习的问题,还能够有意识的提出新颖的想法,甚至有些想法没有过去的经验可参考。

具体方法是:先看上图红色模型,假设我们要训练的模型是上图这种目标模型,需要很多的数据。如果假设数据有限,就需要在上图左侧寻找蓝色领域,蓝色区域的特点为:具有大量的数据、有非常可靠的模型、模型效果非常好。那么迁移学习是:从上图蓝色成熟的模型迁移到红色领域。这类似于人类的类比学习,举一反三。

1月25日下午,武汉大学中南医院重症医学科一病区,医护人员正在为新型冠状病毒感染的肺炎危重患者整理被褥。 中新社记者 周群峰 摄

在数学模型的概念上,机器学习目的在于使训练数据和模型之间的差别变得越来越小,整个过程是一个优化的过程,也是一个概率的过程。我们在寻找模型的时候,实际上是在配置的参数空间里面寻找。但是参数的数量,尤其是在深度学习里面的参数数量非常多,维度可以达到上亿。这些参数一般是机器学习专家来调节,那么如果使用机器,效果是不是更好?

在共享优质教育资源方面,苏州大学(分数线,专业设置)投资公司董事长蒋敬东提到:“虽然国家投入了大量的资金来改善教育现状,也普及了电子白板教学方式,但在偏远山区,师资力量依旧非常缺乏,师资水平也参差不齐,缺少优质的教学内容,普通话的普及亦是一道难题。我认为《最美课本》对普通话的标准化发展有很大帮助,提高了孩子的学习兴趣,提升孩子的阅读能力,进一步树立了孩子的学习自信心。”

同时可以把此过程迁移学习化,即两个数据方的用户和参数的维度都重叠很少的情况下,可以退一步把其映射到一个子空间来进行学习,如此便可得到很鲁棒的学习效果。在具体的电影推荐数据集实践结果如上图所示,右边代表错误率,错误率随着训练的次数急剧的下降。

曾光当天在接受媒体采访时表示,他能理解网民对于疫情通报尽善尽美的诉求,但专家们对于这个未知病毒的了解是“日新月异”的。“它不暴露出来你怎么判断呢?我两次去武汉的感觉就不一样”。

所谓首因效应是指各位考生给考官留下的第一印象,这种印象对面试成败起到了至关重要的作用,考官需要什么样的第一印象呢?

结果是:如果原数据量非常巨大,把它迁移到一个小数据,效果会很好。而且当原数据的数据数量和数据质量不断提高的时候,迁移学习的效果也是不断提高。那么就可以把其落地到一个深度学习的迁移学习上。在上图中红色可以迁移到蓝色,红色已经有一个从左到右的流程,从左边是输入,右边是输出,已经可以达到很好的分类。

当前AI造假主要集中于以下几点:第一个是对数据的造假;第二是对模型的造假;第三是对结果的造假。针对上面三个方面,研究者们展开了针对性的研究,例如对于训练的过程,在考虑原本训练目标的基础上,同时考虑加入对抗的样本,来增强模型的鲁棒性。不仅要考虑一个模型,而且我们要考虑多个模型,从不同的角度来对样本进行分类。假设坏人用了两个模型,我们要用四个模型,假设坏人也学会用四个模型,我们就要用八个模型。

24日,布鲁塞尔难得出现阳光,好天气吸引更多游客慕名而来,现场熙来攘往非常热闹。从老人到小孩大家童心大发,抢着与圣诞版“撒尿小童”合影。

杨强教授是人工智能业界的国际专家,在学术界和工业界做出了许多贡献,尤其近些年为中国人工智能和数据挖掘的发展做出了重要的贡献。杨强教授是国际人工智能界“迁移学习”(transfer learning)领域的发起人和带头人,同时也是国际“联邦学习”(Federated Learning)的发起人之一及带头人。

雷锋网原创文章,。详情见转载须知。

由于今年适逢“撒尿小童”400岁生日,布鲁塞尔博物馆鼓励儿童为小童设计新衣服,入选作品将于2020年展出。

第二个环节,是性能的评估,即评估模型和训练数据差别,这个环节也可以部分的由机器来解决,虽然这个差别本身的定义还是由人来解决,即由数学家来定义一个模型和训练数据之间到底有多大的差别。所以,最近的一些分析,人工智能的基础是不是应该是数学,就体现在:数学家对距离的定义,即各种各样的在不同的空间,转化空间之间的距离的定义。那么如何高效的求解,在这个空间里面找到最佳的配置是一个优化的问题,所以总结起来为:数据的预处理、特征处理和模型训练。这几个方面都可以形成一些搜索空间,可以在这样的空间里面形成优化函数,例如上图左边是三个空间,那么在这三个空间就包括在右边的那个性能的空间里面。

上图的右上角展现的是一个深度学习的拓扑结构,也即从一个神经元到另外一个神经元之间的连接,这种连接千变万化,而且影响是巨大。那么如何找到一个最佳的拓扑结构?这是比较难的问题,这个问题现在也在尝试自动化的方式解决,具体来说是引用了强化学习的概念,如上图左侧所示。首先在深度学习的过程中,右边展示的是如何不断地寻找一个更好的配值,即网络拓扑空间的一个配值参数,然后再返回到设计,由此得到反馈。这就像AlphaGo下棋一样,不同的是把棋盘定义成网络的连接。

每一部分在迭代的过程中,都在贡献自己学到的那一部分的特征值,然后把它传到服务器上,在这里面要特别关注的是上图右边红色加密步骤:在上传和下传时用模块加密,同时包装产品矩阵的参数包,使每一方都相互看不到彼此的数据,同时模型不断壮大。

虽然人工智能现在发展的非常火热,但是人工智能面临巨大的挑战,首先是人才的挑战,培养一个人工智能的人才,包括在学校里的培养,在实践当中培养,前后加起来需要耗费近十年的时间。那么人工智能技术本身是不是可以用来设计人工智能?在人工智能的具体应用环节,有的环节是否能够让人工智能来进行?换句话说,AI的算法是不是可以自动化的进行设计?要解决这个问题需要全面考虑AI算法,尤其是机器学习算法整个流程的每个环节,哪个环节适宜用自动化,哪个环节不能用自动化。

金融机构AI的落地应用特别关心的一个议题是如何做到反欺诈。人工智能的发展有一种技术:Deepfake,可以来模拟一个完全虚拟的人,虚拟和真实的之间不仅人看不出,现在很多人工智能算法也不能区分。

3、用户隐私怎么保护?

电商和视频里大量使用的推荐系统会产生大量的数据,不同的推荐方拥有的数据不同,为了保护隐私,不能粗暴的把所有的手机点击产生的数据上传,所以要采用联邦学习的做法。具体做法如下:

曾光同时表示,武汉此次面对疫情行动有些慢,主要是科学认识的问题,但也不排除一些决策上的犹豫,对自己是不是自信。

这种迁移方式现在也在业界大量的实施,例如汽车金融的风险控制上,大额的汽车贷款往往是很少的,那么就需要迁移学习的解决方案,具体做法是是通过小额贷款,大量数据,通过在两个数据之间迁移得到很好的效果。

例如城市计算,假设在一个城市已经获得了很好的交通出行的预测模型,那么可以把它迁移到一个新的城市,那么在这个新的城市不用收集很多的数据,就可以获得很好的结果。上面提到的自动化的迁移学习,就是用机器学习来学习迁移学习的策略。策略的要点是:对原领域的选择,对迁移学习算法的选择。那么在右边的优化空间里面再找最佳的优化解,把这个问题变成数学的问题,然后便可解决。

自动化的特征工程已经有非常好的平台,例如第四范式公司推出了AutoCross平台,他会把不同维度的特征自动的组合筛选,最后推出最优化的组合。同时现在比较困难的是在自动化机器学习里如何找到一个最优的网络结构,这也是拓扑空间的搜索问题。

曾光说,根据病毒发展,不断调整认识,也不断否定自己,这是个真实的过程。如果都能做到这一点很不容易。

现有深度学习的各种各样的算法,都有一个重要的假设:存在足够的数据。如果数据不够,可以用迁移学习来解决。

当有了一个良好的第一印象之后,接下来考官测评我们的重点就在于答题方面了,在答题时很多考生会怯场,不自信,接下来我们就一起看看自信的具体表现。

越来越多的声音告诉我们,在做人工智能的时候也要做有道德的人工智能。首先一定要保护人的利益,人的利益最大体现就是隐私。大数据一方面可以提高效率,另一方面会涉及到很多人的隐私。现在各种法律法规也频繁出现,例如欧洲的GDPR的保护法,中国也有相应非常严格的个人隐私保护法,并且遍布在游戏、金融、互联网各个方面。过去的情况是:不同的机构把数据聚合到一个大数据公司,同时发挥大数据公司的力量,从而有足够的样本和维度;缺点是会暴露隐私。

第一,着装符合公务人员的标准,切忌过于随意。所谓人靠衣装马靠鞍,面试国家公务员,我们的着装方面可以参考公务人员的着装,以正装为主。注意一定不要过于随意,上身一般是西装搭配衬衣,下身一般是西裤(女生可以选择西装裙)搭配一双制式皮鞋,颜色以黑色或深蓝色为宜,衬衫可以选择白色、淡蓝色、淡紫色等。除此之外,大家还可以参考咱们经常去的银行里的银行柜员的着装,包括其发型、妆容,都是非常值得参考。

“撒尿小童”是比利时的著名景点,只有55厘米高。1619年,雕塑家杜奎斯诺伊创作出这一作品。现在广场上的雕像是1965年的复制品,原始雕像被放置在布鲁塞尔城市博物馆里。

但是和领域特别相关,特别具体的部分,则存在于深度模型的上端,也就是在右边输出的那一部分,那部分尽量的让它不要参与迁移。这便涉及到迁移策略,类似于退火模型。随着时间,我们把这个迁移的重点逐渐推向底层,那么这样就使得下面的这个蓝色的模型的迁移效果变得越来越好,

第二,逻辑清晰,尽量使用语序词。部分考生答题时想到什么说什么,答题没有条理性,考官听起来很混乱,这就需要我们在答题时适当运用语序词(首先、其次、再次、最后或者第一、第二、第三等),这样能够让自己更加明确答题内容,也让考官听得更加清晰。

第二,抑扬顿挫,吸引考官注意力。有些考生答题时语调过于平缓,没有抑扬顿挫,这样不利于吸引考官注意力。

4、AI如何做到反欺诈?

二、一鼓作气——答题自信,不慌不怯

首先认识到数据有两个部分,一部分是描述用户,就是上图右侧U1~UN。另一部分是对产品的描述,用线性代数里面的矩阵描述。对矩阵分解以后,然后认识到虽然有不同的用户,但是产品本身矩阵是共有的,这个矩阵可以用联邦邦学习来学习。具体学习过程是:

很多考生看到这道题时,觉得题目并不难,但是如果实际去作答,却觉得一两句话就说完了,觉得无话可说。这个时候就需要一定的答题思路作为基础,我们在有了明晰的思路后再去完善思路中的内容。比如这道题有两个观点,我们可以先表明我们自身的观点,可以是支持某一个观点,或者说这两种观点各有道理,第二步我们可以谈一谈为什么我们会有这样的观点,第三步则可以谈一谈如何在工作中做一个成功的、快乐的人。这样的思路明晰之后,相信大家的答题内容也就更加充实了。

同时在新闻推荐方面,在财新的新闻推荐中使用的就是联邦学习和迁移学习的推荐引擎。如今此项技术已经开源,并放在了Linux  Foundation上,而且最近已经有所突破。

答题内容是很多考生最在意的一点,也是面试考场的难点,俗话说“肚里有粮,心里不慌”,内容充实时,答题会更加自信,所以内容可以说是我们面试考场的致胜法宝。面试考场上,每道题的作答时间大概是三分钟左右,甚至更短,所以在答题内容上大家首先要明确的就是内容并非越多越好,而是要用最精炼的语言,展现最丰富的内容,这就需要大家首先做到以下两点:

AI 科技评论藉此机会,将杨强教授的观点分享给大家,如下——雷锋网 AI科技评论做了有删改的整理,未经杨强教授本人确认。

2、AI数据不够怎么办?

三、内容致胜——逻辑清晰,语言精炼

在发布会的最后,《最美课本》概念架构师滕浩然表示:“再佳学的初衷是‘不忘初心,让教育回归本质,牢记使命,让每位孩子享有公平的教育’,2020年,我们将继续坚持“为老师、学生、家长减负和赋能”的发展理念,提高内容品质,优化APP使用,加大投入研发AI人工智能和区块链技术的应用,真正建立起美育教育行业内领先的数字化平台;踏踏实实解决老师、学生、家长的难点和痛点。通过赋能老师和学生,推动传统填鸭式教育行业的变革,为促进国内教育的均衡,脚踏实地的立志服务于80%小学生的目标——而这正是《最美课本》和人民网人民智云客户端合作的价值所在。

“公共卫生工作要兼顾到社会正常运转,做最大程度防范,及时发现病人及时隔离,在动态中解决问题。在理想的静态中解决问题,是不现实的。”曾光说。(完)

人民网人民智云与K12美育教育双语智能学习平台《最美课本》签署合作协议

他于2013年7月当选为AAAI Fellow,这也使他成为第一位获此殊荣的华人;之后又于2016年5月当选为AAAI执行委员会委员,是首位AAAI华人执委,2017年8月当选为国际人工智能联合会(IJCAI)理事会主席,是第一位担任IJCAI理事会主席的华人科学家。

教育专家中国教育创新研究院副院长郑琰则表示,对于我国6000多万留守儿童家庭来说,家长陪伴孩子学习是一件非常奢侈的事。现在,家长可以通过《最美课本》随时随地陪伴孩子学习,实时了解孩子的学习情况,帮助孩子定制学习方案。家长还可以提早学习《最美课本》内容来辅导孩子学习,也能多少弥补没有陪伴在孩子身边的遗憾。

第一,思路完整且清晰。在税务系统面试当中,曾经有这样一道真题:有人说成功才会快乐,但美国心理学家肖恩说快乐才能成功,快乐是第一生产力。你怎么看?

第三,眼神交流到位,尽量微笑答题。面试本身就是与考官面对面的交流,我们的自信非常重要的一个体现就是要与考官有充分的眼神交流,适当微笑展现我们的自信从容。

比较巧合的是,不久之前,雷锋网(公众号:雷锋网) AI 科技评论恰好聆听了杨强教授做的一场报告。1月11日,在《清华-中国工程院知识智能联合研究中心年会暨认知智能高峰论坛》上,杨强教授做了《机器学习的几个前沿问题》的报告,针对人工智能算法方面的限制,在机器学习层面对几个前沿问题做了总结。在报告中,杨教授指出,在机器学习流程中的大多数环节都可以进行自动化设计;面对小数据集的困境,迁移学习是很好的解决方案;在隐私保护越来越重视的今天,联邦学习可以实现利用多方数据进行训练,还能够很好的保护每一方的数据隐私。

1、机器学习如何规模化?

最后总结一下,人工智能的成功方面在于:第一能把一个环节给自动化,例如刚开始讲的自动化机器学习。第二分布式的大数据,即怎样能够在保护隐私的前提下,让不同的数据拥有方合作。第三则是高性能计算能力的提升,这一点我没有太多研究,清华在这方面做了非常多的研究,我就不再赘述。谢谢大家!

联邦学习需要很多计算机领域的跨领域的知识,例如多方计算、隐私加密、加密技术、数学、分布式的机器学习、分布式计算。具体怎么做呢?例如要在两个领域之间做迁移学习模型,从A迁移到B,不让A看到B的数据的同时不让B看到A的数据。这可以以通过逻辑回归的办法,把数据的参数、权重等等进行加密,然后把加密的包给运到B,然后加密包会参与到B端的模型训练,然后再把模型加密运到A,如此循环往复多次之,模型也成熟了。上述过程有两点:第一没有泄露任何一方面的数据,第二个达到的效果和用两边数据之和训练出来的是一样的。

第一,尽量用平稳且较大的音量作答。声音是外在气场的第一表现,而且有些考场较大,如果声音不大,考官听不清我们的作答,同时要注意我们音量要尽量平稳,过大的声音会让人觉得是噪音。

《最美课本》是国内领先的K12美育教育双语智能学习平台,据项目负责人李建国介绍,《最美课本》历时五年打造,融入了近200种艺术表现方式,2200多个原创美育教育视频。

第二,礼仪是重中之重。基本礼仪到位也是首因效应中非常重要的一个方面,除此之外我们也应该注意到,基本礼仪在面试测评当中大多会占10%-15%的分数,做好这个方面,就意味着分数更高。我们需要从进门到离场每一步都做到位:一是进门要大方自然,不盯着地面,要尽量抬头,与考官有眼神碰撞时可以适当点头微笑;二是站定之后问好;三是答题过程中减少一些“指手画脚”的手部动作,尊重考官;四是离场时与进场时一样,不可虎头蛇尾。

现在有没有别的办法把模型高质量的建立起来呢?联邦学习(Federated  learning)是一种新的做法。意思是:假设有两个数据拥有方,A方和B方,A方是上面的矩阵,B方是下面的这个矩阵,他们之间可能有数据上的重叠。现在的目的是让A方看不到B方,B方也看不到A方,同时要建立一个共有的模型,这个模型把两方的数据都用上。举例来说:假设一个农夫在养一只羊,他需要把各地的草收集到农庄来喂羊,类似于把数据聚合到中心服务器。但是假设草不能移动到外地,现在能做的是领着羊到各地吃草。也就是让模型先到A方来加以训练,再把模型带到B方加以训练,几次之后,模型就壮大了,而数据不用流出本地,这就是联邦学习的思想。

mldezines.com

Related Posts

Read also x