文本编辑器优化你的 GNOME 体验
与此同时,迁移学习所存在的问题也随之暴露。研究人员发现,某些案例中,源域和目标域之间在视觉形式上仍存在不小的差异。对于研究人员而言,已经很难理解什么能够成功进行迁移,以及网络的哪些部分对此负责。在这篇论文中,研究团队专注于研究视觉领域的迁移学习。 文中涉及的两大数据集分别是: CheXpert 数据集,这是在 2019 年 AAAI 上,吴恩达的斯坦福团队发布的大型 X 射线数据集,此数据集考虑到了不同疾病的胸部 X 射线医学影像,它包含 65,240 位病人的 224,316 张标注好的胸部 X 光片以及放射科医师为每张胸片写的病理报告;
DomainNet 数据集,该数据集发布在 2019 年 ICCV 上,此论文作者收集并注释了迄今为止最大的 UDA 数据集,专门用于探究不同领域中的迁移学习。其中存在显著的领域差异和大量的类别划分,包含 6 个域和分布在 345 个类别中的近 60 万幅图像,范围从真实图像到草图,剪贴画和绘画样本,解决了多源 UDA 研究在数据可用性方面的差距。 DeepMind 首席执行官 Demis Hassabis 也曾表示,迁移学习也是最有前途的技术之一,有朝一日可能会触发通用人工智能的诞生(AGI)。在当下深度学习的发展大潮中看来,迁移学习确实如此。 如今距离这两位 AI 学者的 “预测” 已经过去了近 5 年。那么,目前迁移学习应用正呈现怎样的局面? 在计算机视觉领域,迁移学习已经有了很多成功的应用,甚至在一些任务中,机器能以超越人类精确度的水平完成某项任务。
而在 NLP 领域,迁移学习也是一系列研究突破中的关键组成部分,尤其在跨域情感分析上展现了其潜力。 在这篇论文中,作者便向我们提供了新的工具和分析方法,从不同的角度剖析了不同模块的作用及影响成功迁移的因素,得到了一些有趣的结论,例如,相比高层的特征,预训练模型适合迁移的主要是低层的统计信息。 具体而言,通过对迁移到块混洗图像(block-shuffled images)的一系列分析,他们从学习低层数据统计中分离出了特征复用(feature reuse)的效果,并表明当从预训练权重进行初始化训练时,该模型位于损失函数 “地图” 的同一 “盆地”(basin)中,不同实例在特征空间中相似,并且在参数空间中接近(注:basin 一词在该领域文献中经常使用,指代参数空间中损失函数相对较低值的区域)。 迁移学习应用现状 前百度首席科学家吴恩达(Andrew Ng)曾经说过:迁移学习将会是继监督学习之后,下一个机器学习商业成功的驱动力。
在 2016 年的 NIPS 会议上,吴恩达曾给出了一个未来 AI 方向的技术发展判断:毋庸置疑,目前成熟度最高、成功商用的是监督学习,紧随其后,下一个近 5 年内最可能走向商用的 AI 技术将会是迁移学习。 被网络攻击组织入侵的数十家在线商店的列表被无意中泄露,泄露者是一个被用于在受攻击的电子商务网站上部署隐形远程访问木马(RAT)的dropper。 威胁者使用此RAT来保持持续地获得对被黑在线商店服务器的访问权限。 一旦他们连接到商店,攻击者就会部署信用卡skimmer脚本,这些脚本会在数字skimming攻击(也称为Magecart)中窃取和过滤客户的个人和财务数据。 网上商店服务器中的Sleepy rats 安全公司Sansec的研究人员致力于保护电子商务商店免受Web skimming攻击的侵害。该公司表示,该恶意软件在PHP-based的恶意软件dropper的帮助下,以64位ELF可执行文件的形式发送。 为了逃避检测和妨碍分析,未命名的RAT会伪装成DNS或SSH服务器daemon,这样它在服务器的进程列表中就不会非常显眼。
该恶意软件也几乎全天都处于睡眠模式,每天凌晨7点才会运行一次,以连接到其命令和控制服务器并请求命令。 (编辑:广安站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |