罗杰波、马毅、华刚等谈视觉研究那些事是时候重新定义视觉了

视觉研究日益火爆,顶会论文是指明灯。那么作为顶会主席的研究员如何看待此领域的发展?5月14日上午,微软亚洲研究院创研论坛 CVPR 2020 论文分享会中的圆桌讨论环节邀请了五位担任过视觉领域顶会主席的嘉宾。

他们就论文如何选题、如何看待arXiv、线上会议能否取代线下参会发表了看法。其中加州大学伯克利分校教授马毅谈到:目前顶会领域规模太过庞大,视觉研究是时候重新定义自己了,定义方向重新回到初衷,做高质量,有突破的研究。除此之外,美国罗彻斯特大学教授罗杰波、Wormpex Al Research副总裁兼首席科学家华刚、加州大学圣地亚哥分校教授屠卓文、加州大学美熹德分校教授杨明玄也发表了看法。 1论文选题不要凑热闹

尽管IMF总裁格奥尔基耶娃日前指出各国政府为避免经济崩溃而投入的约8万亿美元财政刺激资金可能还不够,IMF首席经济学家吉塔•戈皮纳斯则认为这些国家为了为医疗和经济救援行动提供资金正在背负巨额债务,而债务占GDP的比重应当自明年开始平稳下来,一些国家甚至可能需要帮助管理国家债务。

(雷锋网、雷锋网、雷锋网(公众号:雷锋网))

不过4月14日揭晓的一季度外贸数据还是明显好于预期——中国3月出口同比下降3.5%,预期下降17.5%;中国3月进口同比增长2.4%,预期下降6.8%;3月当月,外贸进出口同比只降低0.8%,出现明显回升。

杨明玄表示:arXiv的问题已经讲过很多次,但没有人能够去解决,目前是无解的状态,除非有顶级大佬站出来说‘我们现在改变主意了,我们以前讲错了,我们坚持的不是这样,大家重新来过呀’。单盲评审确实有点不公平,2002年NIPS 从单盲变成双盲的时候,有些学校的论文录取瞬间下降。

逆全球化的桎梏与贫富差距扩大的隐忧

马毅表示,鲁棒性问题和现在深度模型拟合数据,做黑盒系统以及依赖数据标签有关。深度学习系统并不关心数据内在的描述表达,其模式只是input-output。数据导向的方法可能会解决一些问题,但仍然有缺陷。例如,深度学习虽然在识别领域有些进展,但是现在3D领域是最大的软肋,因为它对鲁棒、精度要求非常高。但是为什么需要真正的鲁棒性?马毅提到因为一些场景必须要求鲁棒,例如军事、医疗、无人机都是关乎人命的。 

罗杰波表示:视觉分为:识别、描述、推理。现在CNN解决了很多大部分识别问题,计算机视觉进化到了描述问题,下一步会进化到推理问题。现在已经有人将知识图谱和常识这些东西加入模型,从而尝试解决视觉系统或者AI系统到底是什么样子。

IMF首席经济学家吉塔•戈皮纳斯(Gita Gopinath)在报告中指出,未来两年全球GDP的累计损失可能达到9万亿美元,大于日本和德国经济之和。

计算机视觉领域将来如何发展,对计算机视觉会议规模的发展有何看法?

另外,报道指出,上述病例也包括在公共卫生实验室检测呈阳性的“推定阳性”病例,这些病例正在等待美国疾病控制与预防中心的确认。

IMF预计,如果全球范围内基本控制了新冠病毒的传播,而且没有出现第二波或第三波大流行,那么全球经济在今年下半年将出现温和反弹,而若疫情持续更长时间,2020年全球GDP可能比基线预测进一步降低3%,如果疫情持续到2021年,明年的增长可能比基线预测进一步降低8%。

然而尽管经济危机在全球的蔓延是牵一发而动全身,各国救市的举措却是各自为营,尤其是在逆全球化思潮不断抬头的当下。对此,IMF在报告中指出,多边合作对全球经济健康复苏至关重要。

而投资方面,根据国家统计局投资司司长彭永涛的判断,疫情对固定资产投资冲击明显,投资随复工复产有望企稳向好。疫情期间,全国固定资产投资大幅下降,制造业、基础设施、房地产开发三大领域投资增速均下降明显,但一些行业如高技术产业、卫生等领域情况好于全部投资。当前,中国投资持续平稳增长的基本面没有改变。

大佬们谈笑风生       

另外,它确实对领顶会审核带来很多工作,因为作为领域主席和程序主席往往会在“这篇文章是谁的idea”纠结。所以现在顶会的投稿政策还并不适应现在这种情况。顶会应该及时改变,不能装作看不到,可以向期刊一样的单盲评审。

此外,消费方面,浙商证券研究团队指出,随着疫情防控战线拉长,疫情的冲击已从供给端传导至需求端,居民的消费信心开始受到一定影响,消费回暖将呈现渐进增长的节奏。预计二季度起消费数据将开始稳步提升,五一的“五天长假”有望助力消费数据冲高。

近来,美军驻伊拉克基地接连遭到迫击炮和火箭弹袭击。报道称,频繁的报复行动是继伊斯兰革命卫队特种部队“圣城旅”指挥官苏莱曼尼和什叶派民兵武装副指挥穆罕迪斯在巴格达国际机场遭美方刺杀身亡后开始的。

中国人民银行授权中国外汇交易中心公布,2020年4月10日银行间外汇市场人民币汇率中间价为:1美元对人民币7.0354元,1欧元对人民币7.6932元,100日元对人民币6.4847元,1港元对人民币0.90744元,1英镑对人民币8.7644元,1澳大利亚元对人民币4.4541元,1新西兰元对人民币4.2741元,1新加坡元对人民币4.9669元,1瑞士法郎对人民币7.2781元,1加拿大元对人民币5.0306元,人民币1元对0.61425马来西亚林吉特,人民币1元对10.5487俄罗斯卢布,人民币1元对2.5638南非兰特,人民币1元对172.29韩元,人民币1元对0.52221阿联酋迪拉姆,人民币1元对0.53478沙特里亚尔,人民币1元对45.9593匈牙利福林,人民币1元对0.59152波兰兹罗提,人民币1元对0.9709丹麦克朗,人民币1元对1.4136瑞典克朗,人民币1元对1.4496挪威克朗,人民币1元对0.94940土耳其里拉,人民币1元对3.3630墨西哥比索,人民币1元对4.6461泰铢。

也即从知识层面入手解决问题。从计算机视觉的定义:从视觉信号里提取描述没提到只是做识别。计算机视觉的初心是进化到语义,这就需要将语言和视觉知识融合起来,这是不可避免的,也是计算机视觉必须进化的方向。

如何看待arXiv的文章?

计算机视觉顶会规模发展有何看法?

前一交易日,人民币对美元汇率中间价报7.0536。

屠卓文表示:现在计算机视觉更多的是考虑CNN算法,当然RNN、Attention这些都在进来,但是这一套系列中视觉和语言还是不太一样。计算机视觉改变一两个pixel,不会改变太大的结果,但是在语言里改变一个字,那就是天壤之别。

arXiv 是一个收集物理学、数学、计算机科学与生物学论文预印本的网站,上面的文章未经同行评审,作者对文章多半保持严谨态度。但是也可以防止自己的想法在论文被收录前被别人剽窃(将预稿上传到arXiv 作为预收录)因此这就是个可以证明论文原创性(上传时间戳)的文档收录网站。那么,顶会应该如何看待arXiv ?

此外,IMF总裁格奥尔基耶娃(Kristalina Georgieva)日前指出疫情大流行让富国和穷国都受到冲击,但许多非洲、亚洲和拉丁美洲的国家因为卫生系统较差,面临的风险将更高。

个体的健康焦虑和国家的债务不安全感

杨明玄说道:同意做有感兴趣的事情,但是要量力而为,世界那么大,事情那么多,不要非做极度有挑战的事情。另外,越刁钻的老板(导师)越能提高你论文通过率,毕竟他们看的论文多、经验多。写作技能要慢慢提高,多看paper,将它们的框架写下来,可以把自己代入评审角色,看看自己的论文和别人有什么不一样,你自己会不会选你。经验都是积攒出来的,就像一眼就能够看出问题的老医师。

对此,IMF呼吁各国央行将流动性互换额度扩大至更多新兴市场国家,目前这些国家面临着双重问题:一是经济活动的停滞;二是资金大量流出至美国公债等避险资产,导致金融状况趋紧,一些国家可能需要对资本外流采取临时限制。

所以要求双盲却arXiv是伪君子的做法。深度学习是否结合传统基于符号的方法?

在讨论完论文如何写、如何选题、如何看待arXiv之后,圆桌论坛也向如何克服深度学习依赖数据的问题发起了讨论。能否将传统基于符号的方法与深度学习结合起来从而增强鲁棒性?能否将这种融合的发展路线带入计算机视觉领域?杨明玄提到,现在的深度学习方法或许没有很强的鲁棒性,实验也不好做,但是总要有人做。

所以,计算机视觉和语言在同属AI框架下,需要从各自的角度去考虑问题。最终的融合还是需要的,但是要明确视觉和语言确实有很多不一样的地方,如何考虑角度非常重要,现在这条路还在探索阶段。

据悉,国际货币基金组织拥有1万亿美元的借贷能力,目前已收到“空前数量的紧急资金援助请求”——在189个成员国中,有100个国家,其中一半是低收入国家,要求获得该组织的财政支持。

而就在今年1月,IMF曾预计全球经济2020年将增长3.3%,2021年将增长3.4%,虽然现在这一数字已被修正为5.8%,但这一预计增长的基数是对2020年全球经济增长的较低预期。

经济学人智库全球预测部主任德马莱斯也指出,如果控制疫情的努力耗尽了发达国家的财政收入,并大幅增加了公共支出,这可能引发主权债务危机。许多受疫情影响最严重的欧洲国家,如意大利和西班牙的财政状况在疫情暴发前就已疲弱不堪,西方国家不断增加的财政赤字对经济增长的长期影响也是未知的。

线上、线下参会有何优缺点?罗杰波表示,线上会议好处非常多,但是有个致命的缺点是:没有围观效应。Zoom此类的会议都是讲座性质的,在交流方面还差一些,缺少那种大家对‘海报’评论的氛围。所以他认为线上会议在短时间还不会取代线下会议。

诺亚控股集团首席经济学家夏春指出,新冠疫情在2月24日开始的一个月时间里造成了全球资产价格大缩水,考虑到各国资本市场参与率主要集中在富有阶层,应该说这次全球疫情短暂地降低了贫富差距,但如果疫情延续并且反复无常,造成失业率上升,则可能加大收入差距。

疫情下的中国经济展望

自身韧性仍在,外部风险陡增

然而该值还是明显低于此前其他一些国际机构的预测——投行野村预计今年中国GDP增速为4.8%,渣打银行预测为4%。不过IMF预测中国经济在2021年将反弹增长9.2%。

雷锋网原创文章,。详情见转载须知。

华刚博士对罗教授的观点表示同意,他也对顶会会议规模发表了看法:其实每个研究都有一个核心,大家都围绕这个核心开展自己的工作,当大量的研究者挤进来的时候,必将会扩展新的方向。杨明玄教授也表示规模大、人数多非常好,但是conference和workshop方式还是不同,资深的人士都会去workshop,而会议吸引的更多是学生。

顶会如何看待arXiv这个问题,CVPR和ICCV都有自己的政策,投稿之前弄清楚规则就好。马毅表示:arXiv这个领域本身是物理和数学,它所对应的评审模式不是双盲。既然允许论文post在arXiv上面,那么顶会评审就不应该是双盲,因为这会造成许多混乱。

根据IMF的《世界经济展望》报告,发达经济体以及新兴市场和发展中经济体同时处于衰退之中,这种情况自“大萧条”以来第一次出现。

马毅教授还谈到,对比现在视觉会议的情况,计算机视觉可能要重新定义自己了,领域发展壮大是好事情,但是从研究主题和研究社区可能要重新思考了,看看能否找到更激动人心的事情。

IMF的报告显示,在全球四大经济体中,欧元区2020年经济增速预期为-7.5%,美国为-5.9%,日本为-5.2%,只有中国是正增长,为1.2%。

另有外媒称,该基地遭到2枚火箭弹袭击。

华刚总结到:1、论文选题,切莫跟风,要做有兴趣,这样才能放入精力;2、训练自己的技巧,读一些paper,知道好paper长什么样子,语言不一定华丽,让一般的人读懂;3、明确和导师的关系:判断你的论文是否能接受,能增加你论文接受的几率。屠卓文最后补充到:写文章的原则是:帮人帮己,帮助自己考虑问题,但更重要的是别人怎么看你的文章,能不能帮助别人理解你的工作。并不是每一项工作都能达到很高的境界,在这过程更重要的是对得起自己的努力。 

对此,经济学人智库全球预测部主任德马莱斯(Agathe Demarais)也表示,疫情不确定性的增加还将导致家庭预防性储蓄的增加和全年商业投资的推迟。在政府解除封锁后,一些消费者可能还会继续自我隔离,因为他们担心感染新冠病毒,这将限制私人消费的复苏。

而除了国与国之间的贫富差距问题,国家内部的收入差距也有拉大的趋势。

人数一多,从众心理就非常严重。现在一些研究者的角色更像网红,并不是在寻找真正的追求,但是寻找真正的突破才是做研究的初衷。

不过尽管IMF认为其放贷能力“相当可观”,但随着危机的全面冲击波及发展中国家,日后可能需要更多的资源加持。IMF首席经济学家吉塔·戈皮纳特表示,由于许多最贫困的国家还未感受到大流行的最严重影响,呼吁国际债权人达成协议,允许最贫穷国家延后支付债务直至今年年底。

马毅补充到:写文章,做研究有两个阶段,先学习做学问的技巧,把一个事情讲清楚,把控住语言,最早的几篇文章是在训练自己的技巧,而不是做的研究有多么了不起。过了这个坎之后,可以随心所欲做自己想要做的研究,重点在于做研究而不是写文章。另外,不要把评审看的太重,一些重量级学者,例如Yann LeCun的论文也有被“砍掉”的经历,所以更重要的是你的问题有没有价值,第二你有没有把问题写清楚。

在德马莱斯看来,这些国家中任何一个出现潜在的债务危机,都将迅速蔓延到其他发达国家和新兴市场,将全球经济推入另一场可能更糟糕的衰退。这与第二或第三波疫情等其他风险场景一道给全球经济预期带来了严重的下行风险。

北京大学经济学教授曹和平此前表示,他并不赞同过于悲观的预测。由于中国经济的韧性以及政策力度的加大,他认为,中国全年经济增速有可能落在4%至5.5%区间内。

人们生命和生计所受到的影响在很大程度上取决于病毒的流行病学、防控措施的有效性以及治疗方法和疫苗的开发,而所有这些目前都存在极大的不确定性。

 深度学习是计算机视觉的研究技术之一,深度学习在各领域大火的时候,也影响到了计算机视觉,做学者的要有自己的原则,罗杰波表示:不刷榜单,不凑热闹,明白学者在算力方面是比不过企业的,在选题的时候要找自己感兴趣的话题,找自己认为独特的点去做,不是说别人做什么你就做什么,写作时要明白写的东西是给别人看的,不是给你的导师,不是给学术带头人看的,要让评审看得出妙处。

华刚表示:arXiv 总体上有着非常积极的一面,因为它能够让工作更快分享。但是问题在于:上面有大量的文章,实际上并没有经过同行审议,所以鱼龙混杂。所以在看文章的时候需要自己有判决力,对个人来说一些论文只会看看标题,看看摘要再决定是否读下去。

而一方面除了消费者信心尚未建立起来,另一方面,对于国家债务高企的担忧已经提上议程。

所以,不忘初心,正当时。

发达经济体今年的增长率预计为-6.1%,而正常增长水平远远高于发达经济体的新兴市场和发展中经济体预计也将经历负增长,2020年增长率为-1.0%(若不包括中国,则为-2.2%)。

不过无论哪种情况,疫情对民众信心和需求的影响都将是长期的。这也意味着,即使政府开始放松对公众集会的限制,并允许一些关闭的餐馆和商店重新开业,由于经济活动的降温更是工人和消费者的一种行为反应的投射,经济也将缓慢复苏,并且经济重启的速度快慢取决于公众的恐慌情绪在多大程度上得到安抚。

美国大数据公司Civis Analytics在过去两周进行的一项针对全美的在线调查发现,超过80%的美国人支持限制餐馆和健身房的开业。此外,西顿霍尔大学(Seton Hall University)的一项调查显示,在研制出针对该病毒的疫苗之前,有七成美国人表示不愿意参加体育赛事。

毫无疑问,这是一场与以往截然不同的经济危机。

写作技巧有两个建议:第一找你欣赏人的文章去follow,学习怎么开头、怎么结尾、这么承前启后。第二点,把自己带入评审的角色,做自己最严厉的评审,把自己训练成最难说服自己的人,不要自我满足,不停的反驳自己一下。

马毅教授表示他非常怀念他当学生的那段日子,那时候的视觉会议有两个特点,一个是小,即只有两三百人,另一个特点是主题非常新,能带给人非常多的启发,给年轻人非常多挑战。

在曹和平看来,接下来影响中国经济主要的不确定因素是疫情发展,国内不能有反复,国外疫情需要得到快速控制。否则,疫情将影响国内复工复产,国外需求疲弱也会影响中国的出口。

mldezines.com

Related Posts

Read also x