3月21日下午,潘伟教授在正心407开展人工智能前沿技术讲座,讲座主题为《ChatGPT的基础网络——Transformer的原理、架构与应用》,此次讲座为我院与计算机科学与信息工程学院联合主办。
潘伟教授从技术角度介绍ChatGPT的基础深度学习神经网络——Transformer的原理与实现架构。讲座从机器翻译的编码-解码模型开始,介绍注意力机制及其计算方法;Transformer的架构,最后介绍Transformer在自然语言处理和计算机视觉领域的一些具体应用。
数据科学与智能工程学院和计算机科学与信息工程学院的部分师生聆听了此次讲座。