与McAfee高级数据科学家Sherin Mathews的独家谈话

0
2269

Asif:告诉我们到目前为止您在AI和机器学习方面的旅程。 哪些因素影响您决定从事AI领域的博士学位和职业? 

谢林: 最初,我对机器学习(ML)和深度学习(DL)领域很感兴趣,因为它为在复杂领域(如视频/图像分类,跟踪人脸识别和生物医学信号处理)中的应用提供了无限的可能性。我觉得我还有很多东西要学习,发现这一领域的新事物,解决具有挑战性的任务并能够取得重要成就。我的天生好奇心和挑战自我的机会是推动我探索和追求博士学位的动力。在这个领域里。 在我的博士学位中,我为与远程健康监控系统(例如,可穿戴传感器的活动识别)相关的分类任务开发了新颖的字典和DL算法。完成博士学位学位确实需要多年的努力,但是我认为这是我一生中做出的最好的决定之一。这段旅程不仅使我在该领域的知识丰富了,而且还教会了我如何应对挫折并在应对挑战的过程中具有说服力,而挑战对行业的成功至关重要。在我的行业工作经验中,我具有创建新的ML模型以改善和提高网络安全产品的效率的能力,并致力于可扩展AI(XAI)和Deepfake等前沿研究。我真的很感激我多年来的学习,并对XAI,道德AI,打击深造和数字错误信息的机会以及与ML和DL相关的主题以及网络安全应用充满热情。

Asif:计算机视觉与人类视觉有何不同? 您在开发机器学习算法时要考虑哪些因素?

广告Coursera Plus标语,包含约翰·霍普金斯大学,谷歌和密歇根大学的课程,突出显示数据科学职业发展的内容

谢林: 计算机视觉(CV)允许计算机通过像素“查看”并进行数字解释,结合模式识别并通过识别图像或视频中的对象来模仿人类视觉。这是通过重复完成的,因为需要向计算机提供尽可能多的图像或视频。另一方面,人类视觉围绕光而旋转,尽管它和计算机视觉都有内在的偏差,但CV可以更容易地被愚弄。 已经发现,最近的计算机视觉框架容易受到精心设计的输入样本(称为“对抗性示例”)的攻击。在测试阶段,对抗性干扰很容易愚弄DL模型。由于对抗性示例的易感性或责任性成为主要风险之一,因此在安全关键型环境中开发和应用深度学习时,对对抗性示例进行攻击和防御是重要的考虑因素。

阿西夫(Asif):近代以来,假货越来越多。您能解释深造假背后的技术吗?您如何看待这些新兴技术对日常生活的影响? 我们如何围绕AI建立更多的信任?

谢林: 通过合成生成的,高度逼真的修改后的视频(也称为“ deepfake”),继续捕获 对计算机图形学,简历和安全研究人员的关注。这些领域和DL的最新进展使合成引人入胜的伪造图像,音频和视频变得越来越容易。 Deepfake的采用和武器化的可能性正在数字领域引起警报。  

我研究了基于对抗网络的生成(GAN)技术在Deepfake创作中的潜力。 GAN培训结合了生成器和鉴别器。生成器接收输入图像和所需属性以进行更改,然后输出包含该特征或属性的图像。然后,鉴别器将尝试区分生成器生成的图像和真实的训练示例。生成器和鉴别器以另一种方式进行训练,每一种都试图相对于另一种优化其性能。 

理想情况下,生成器将收敛到一个点,在该点上,输出图像与地面真实情况非常相似,以至于人类将无法区分这两个图像。因此,GAN可用于产生非常接近真实输入图像的“伪”图像。诸如AttGAN,StarGAN和STGAN之类的GAN技术主要是部分面部操作方法,而PGGAN和StyleGAN2可用于全脸合成。 

如此复杂的篡改视频确实威胁着我们的政治,法律和媒体系统。伪造品的存在会破坏信心,并可能破坏我们对社会的信任。我们将需要发展新颖的共识形式,新方法来规范深造产品的使用, 以及基于替代的信任验证形式就社会状况达成共识的新方法。

Asif:AI研究人员目前如何检测到Deepfake? AI研究人员如何改善其检测方法?

谢林: 当前的框架主要关注于软生物识别,CV和DL算法以检测深造假。早期研究方向之一是利用眨眼检测功能,这是一种在合成假视频中无法很好呈现的生理信号。但是,高级的伪造者现在可以使用后处理和更高级的模型来创建逼真的闪烁效果。  

其他检测深度假货的研究是基于不一致的头部姿势和面部图像翘曲缺陷。很少有其他工作旨在提高CNN(卷积神经网络)取证模型的泛化能力。 它在训练之前增加了图像预处理步骤,以迫使鉴别器学习更多内在的和可概括的特征。这些框架着眼于高斯模糊的检测,由照明估计产生的阴影伪像以及对面部特征和缺失反射的不精确几何估计。 CNN,RNN和基于LSTM的框架以及VGG,Inception,Xception,ResNets等预训练模型也已显示 检测深层伪造的有希望的结果。 

随着最近发布的带有附加注释的大规模Deepfake数据集,我希望这项研究将继续发展并帮助缓解这一问题。希望这项研究能够 lead 将来会提供给更大的高质量Deepfake数据集。 

作为未来的研究领域,利用 转移学习能力以进一步推广当前模型以及使用多模式技术。 另一个需要考虑的潜在领域是GAN生成的伪图像中可操纵像素的定位。可以通过提出更好的定位方法来做到这一点,这可以通过利用上采样方法的缺陷来证明对看不见的GAN方法有用。借助AttGAN,StarGAN和StyleGAN2等高级GAN,它可以 还将有助于形象化每个图像中的假纹理,并根据不同的GAN和上采样方法对其进行分类。

Asif:什么是可解释的AI(XAI)?告诉我们在恶意软件的环境中它是如何工作的。

谢林: 网络安全行业利用ML和DL技术来应对不断发展的网络威胁,例如恶意软件。虽然ML和DL模型对于决策制定变得越来越重要,并使得不可能实现的壮举成为现实,但这些模型本质上是一个“黑匣子”,因为模型用来进行预测的过程可能使人类难以理解。 XAI建议业界通过创建一套能够产生更多可解释模型并保持高性能水平的技术,朝着更加透明的AI转变。 XAI通过提供对决策的解释并允许用户,客户和利益相关者深入了解系统,从而使DL模型更加透明。’的模型和决策。 这些说明对于确保算法的公平性,透明性和隐私性,以及识别潜意识偏差,数据漂移,模型衰减和训练数据中的潜在问题非常重要。 XAI还确保算法按预期执行。使用XAI,领域专家,分析师和客户甚至可以了解和分析动作和预测,甚至是最复杂的神经网络体系结构。 XAI的挑战在于,在利益与基于功能的机密和知识产权的暴露之间取得平衡。随着XAI的改进,分界线可能会变得模糊。

Asif:您能否列举一些对您的思想影响最大的书籍,课程或其他资源? 

谢林: 图书 计算机视觉 由理查德·塞利斯基(Richard Szeliski)和 模式识别,机器学习 Christopher Bishop的文章是学习基本概念的理想起点。这些帮助我对CV和ML的学科有了全面的了解。多年来,模式识别领域经历了长足的发展。除了最近的论文,诸如 统计学习的要素 由Trevor Hastie,Robert Tibshirani和Jerome H.Friedman撰写,以及 凸的 优化 Stephen Boyd的著作也有助于理解和支持机器学习及相关领域的研究。如果有人喜欢专门学习CV中的特殊主题(例如t3D CV)以及与从多个图像中推断几何图形有关的方法,那么这些书 计算机视觉中的多视图几何 理查德·哈特利和安德鲁·齐瑟曼 3-D计算机视觉入门技术 通过Emanuele Trucco 亚历山德罗·韦里(Alessandro Verri)将派上用场。 

Asif:您对想跳入该行业的机器学习学生有何建议?

谢林: ML和DL构成了AI的症结所在。除了这些书之外,我强烈建议您参加统计学,ML和DL领域的正规课程。有更多关于优化技术的高级数学课程,如果您有兴趣对该领域进行专业学习,这是非常好的。 人们还可以寻求有关特定主题的在线认证,新兵训练营和大规模开放式在线课程(例如Coursera,edx,Udacity)。

一旦掌握了基础知识,就可以开始在开源数据集,IEEE竞赛和竞赛中进行练习,以获得一些实际的反馈和经验。此外,尝试参加当地的聚会或学术会议。这不仅有助于保持最新的研究成果,而且还提供了一个与该地区更多有经验的人会面的机会。最重要的是,必须了解随着学习与创新的齐头并进,人们需要不断地学习。

Asif:您对MarkTechPost.com有何看法?

谢林: MarkTechPost 对于有抱负和经验丰富的数据科学专业人员而言,是一个很棒的信息资源社区。它提供了ML,DL和数据科学领域的最新研究更新,并且在 AI论文摘要大学研究文章。通过免费的AI教程和视频讲座,我认为这对于许多有抱负的数据科学家来说也是有用的资源。我希望社区不断发展,以建立和传播对下一代数据科学生态系统的认识。

缩略语: 

AttGAN,PGGAN和STGAN代表属性GAN,渐进GAN和选择性转移GAN。 RNN和LSTM对应于递归神经网络(RNN)和长短期记忆(LSTM)。两者都属于深度学习领域中使用的人工神经网络。

广告

发表评论

请输入您的评论!
请在这里输入您的名字

该网站使用Akismet减少垃圾邮件。 了解如何处理您的评论数据.