环球网校是美国纳斯达克上市企业欢聚时代(NASDAQ:YY)旗下品牌 | 住房和城乡建设部 建筑人才培训合作单位
您现在的位置在: > 建筑考试 > 一级建造师 > 考试动态 >

CCF ADL第147期(2024.5.24 - 26日北京)大模型与检索主题相关信息

2025-02-05 来源:网络 作者:佚名

CCF纪律边界讲座课

CCF纪律边界讲座课

CCF

#

CCF ADL 147号

#

主题模型和检索

#

北京,2024年5月24日至26日,北京 #

大型模型(LLM)和信息检索系统是人类获取信息的两种主要方法。一方面,LLM可以授权,升级和改变传统的IR系统,以促进信息检索技术的进一步发展。另一方面,IR系统还可以有效缓解大型模型的幻觉问题和及时性。两者的紧密组合和彼此的融合将不可避免地促进人工智能时代信息获取方法的巨大变化。

#

学术主任:中国杜·齐兴(Dou )教授 #

组织者:中国计算机协会

#

在本期的ADL中,我们邀请10位学术和行业的10名高级学者和杰出的从业者检索增强的大型模型方法(RAG),并通过大型模型增强了检索方法。参加6个精彩的特殊讲座和3个主题报告。嘉宾包括汤吉大学特别研究员王霍·芬,杜·齐兴(Dou 中国科学院计算机技术研究所,Pang Liang Wang Liang,Asia Asia 的自然语言计算小组的高级研究员Lin ,High -人工智能学校助理教授中国人民大学的Fang Kun是 Rag 的负责人Fang Kun,Smart Speed AI解决方案的专家Feng ,Jina AI共同创立了和CTO Wang Nan。 #

活动时间表: #

5月24日星期五 #

9:00-9:10

#

开幕式 #

9:10-9:20

#

所有照片 #

9:20-12:00

#

特殊讲座1:知识搜索增强:范式和关键技术 #

讲师:汤吉大学特别研究人员王浩芬 #

12:00-13:00 #

午餐 #

13:00-16:00

#

特别讲座2:大语模型和智能信息检索技术的融合 #

讲座:中国人民学院教授杜齐兴教授

#

Zhu Yutao,《中国人民大学》

#

5月25日星期六

#

9:00-10:30

#

特殊讲座3:GE语义矢量模型和大型语言模型检索增强

#

讲座:北京齐尤恩人工智能研究所的研究人员刘Zheng

#

10:30-12:00 #

特别讲座4:检索技术和增强发电的思维(RAG) #

讲座:中国科学院计算技术学院Pang Liang #

12:00-13:00

#

午餐

#

13:00-16:00 #

特别讲座5:大型模型时代的搜索引擎的机会和挑战

#

讲座: Asia研究所的自然语言计算小组的高级研究员Wang Liang #

5月26日星期日

#

9:00-12:00

#

特别讲座6:大型工具增强功能

#

讲座:中国人民大学人工智能学院林·扬卡(Lin ) #

12:00-13:00 #

午餐 #

工业专业 #

13:00-14:00 #

主题报告1: Rag练习路 #

讲座:Fang Kun,负责智能抹布技术的人

#

14:00-15:00 #

主题报告2:智能光谱抹布练习尝试 #

讲座:潮牛,智能光谱AI解决方案专家 #

15:00-16:00

#

主题报告3:矢量模型的建筑,培训和未来发展

#

讲座:Jina AI的CO - and CTO Wang Nan #

邀请发言人(按讲座或报告顺序排序): #

Wang Hao Fen

#

汤吉大学特别研究员 #

讲师:博士主管 的特别研究人员Wang Hao Fen。他长期以来一直是CTO在前线人工智能公司的职位。他是世界上最大的中国开放知识地图联盟之一。他负责主持许多与国家AI相关的项目,在AI领域发表了100多篇高级论文,并被引用了3500次以上,H-idex达到29。虚拟偶像,“琥珀色奇幻”;建造的智能客户服务机器人积累了超过10亿用户。目前,他担任中国计算机协会条款副主任,Sigkg主席,自然语言治疗专业委员会秘书长,上海秘书长,中国信息协会主任,语言副秘书长 - 和知识计算专家委员会,上海计算机社会的社会地位,例如自然语言待遇专业委员会副主任和上海 AI校友会的秘书长。 #

特殊讲座:增加知识检索:天堂和关键技术

#

报告简介:知识检索增强技术引入了大语的其他知识来源,有效地减轻了幻觉和时间效果的问题,并迅速成为优化大型模型实践的关键技术。在技??术迭代的过程中,RAG()和许多技术,例如对结构索引,知识图,矢量数据库,大型建模和及时工程的优化。已经提出了许多功能模块。挑战。该报告将从范式,关键技术和应用程序开发的角度全面整理和分析抹布,旨在掌握技术发展趋势和未来的方向。通过对当前研究状况的全面分析,我们提出了模块化抹布和抹布流的研究范式,总结了6个主要功能模块,包括50多个操作员操作,并从100多篇论文中凝结。 7典型的典型典型典型典型典型类型的抹布流设计模式为抹布系统的设计提供了指导。基于这些范式,我们进一步推广了该系列的开源工作,建立了基础,全面涵盖了RAG研究人员和开发人员所需的信息,并提供了多维分析视图,该视图支持高度定制。协助研究人员和工程师快速构建前沿方法,并比较公共或定制数据集和不同抹布流效应的快速验证。

#

Dou

#

中国人民大学教授 #

演讲者:中国人民人大学高级人工智能学院教授,??博客,博客,博客主任,中国计算机社会大数据专家委员会秘书长,中国信息学会主任和副副总裁中国信息学会信息检索委员会主任。主要的研究方向是人工智能,智能信息检索,自然语言处理等。他在国际著名的学术会议和期刊上发表了100多篇论文。 AIRS 2012)最佳纸张奖,国家信息检索学术会议(CCIR 2023,CCIR 2023)最佳纸张奖,等等。

#

朱约塔

#

中国人民大学的后者 #

演讲者简介:朱·尤塔(Zhu Yutao),中国人民大学的博士后 - 宗教学院和杜·齐兴教授。他于2023年在蒙特利尔大学获得博士学位。在此之前,他于2023年和2023年获得了中国人民大学信息学院的硕士和学士学位。在博士期间,他赢得了的奖学金,并赢得了诸如优秀博士学位奖学金之类的荣誉。目前,已在人工智能和信息检索领域的国际高期刊和会议上发表了40多篇学术论文。他是中国人民大学大型模型项目团队的成员。他负责基础模型的培训,并在大型模型的开发和研究中拥有丰富的经验。 #

特殊讲座:大语言模型和智能信息检索技术的整合

#

报告资料:大语言模型在自然语言处理领域取得了出色的成就,并且通过信息检索获得信息的重要方法也产生了深刻的交集。一方面,具有大型语言模型的出色语义理解能力,它可以直接将其直接应用于信息检索的传统任务,例如查询重写,文档搜索和文档。另一方面,信息检索系统还可以为大语言模型提供其他知识源,从而有效地减轻了其幻觉问题和及时性瓶颈。此外,大型语言模型本身还为信息检索系统带来了一种新颖的交互式模式,该模式催生了创新的范式,例如由大型模型驱动的搜索智能。该报告将围绕以下方面进行解释:首先,基于信息检索系统的通用模块,根据五个模块,包括查询和重写,检索,重型编排,读者,读者和智能主体,该系统整理更多在不久的将来,最近的100篇文章将大型语言模型应用于相关的信息检索工作。在此基础上,我们将报告使用指令罚款技术来改善大型模型的检测性能的最新尝试。此外,该报告还将探讨一些新方法和新想法2024年北京结构工程师报名时间及要求,以将生成检索与大型模型集成。最后,我们将在RAG框架中介绍最新的研究进度,以检索需求识别,查询重写和检索结果压缩。 #

刘郑 #

北京人工智能研究所的研究人员

#

演讲者简介:北京人工智能研究所的研究人员Liu Zheng,信息检索和知识计算方向的技术负责人。香港科学技术大学博士。他连续曾在微软研究所和华为2012实验室技术专家担任研究员。长期以来对自然语言处理和信息检索领域的研究。领导着通用语义矢量模型Baai的发展,全球累积下载量的量超过1000万次,全面的绩效行业领导。许多研究结果适用于重要的工业场景,例如 Bing, Petal。近年来,他在AI和NLP相关的领域发表了50多篇顶级学术论文,并获得了杰出论文奖。举办了学术活动,例如“大型遇见的Web 2024”和“ Tois问题”和“ tois”问题。

#

特殊讲座:GM语义矢量模型和大型语言模型搜索增强 #

报告简介:通用语义矢量模型是AI场景中的基本组成部分,例如搜索,问答,个性化等。同时,向量检索技术在增强大语言模型检索方面也起着重要作用(RAG(RAG) )。该报告将探讨“矢量学习中的几种关键技术”,并讨论“大型时代的时代检索技术的机会和挑战”。 #

Pang Liang

#

中国科学院计算技术研究所的副研究员

#

讲师简介:中国科学院计算机技术研究所的智能算法研究所副研究人员Pang Liang,新加坡国立大学的来访学者,研究方向是自然语言生成和信息检索。他在国际会议上发表了30多篇论文,引用了2700多篇。中国信息学会青年工作委员会委员会,以及中国科学院青年晋升的成员。他因中国信息协会的出色博士论文而获得了奖项。提出的深文匹配模型在QQP文本匹配竞赛中赢得了第四个全球。 2023年多人挑战标准研究全球冠军。跳起来更开放的问答位置在全球列表中排名第一。 #

特殊讲座:检索技术和增强发电的思维(RAG) #

报告资料:近年来,强化范式有效提高了大语言模型内容的准确性和信誉。它的核心组成可以分为信息检索模块和大型语言模型生成模块。从信息检索模块的角度来看,检索领域可以广义化和通用,这有助于在大型模型的各个领域中选择有效的信息;稳健性和效率可以帮助避免检索噪声信息对结果的影响;模块之间相互作用,信息检索模块的机理设计和大型语言模型模块之间的相互作用的观点也是成功或失败的关键。最后,在检索过程中,寻找检索以增强生成信息电路的观点,新生成的内容将对信息检索产生潜在的影响。

#

王梁

#

微软亚洲研究所的高级研究员

#

讲师资料: Asia研究所的自然语言计算小组的高级研究员Wang Liang。主要的研究方向是增强信息检索,问答系统和基本模型。在2014年和2023年,他获得了北京大学的学士学位和硕士学位。毕业后,他曾在猿类辅导在线教育中担任算法工程师。目前,在ACL,EMNLP,NAACL,AAAI,ICLR和其他自然语言处理和机器学习领域的其他会议上已经发表了近30篇论文。他曾担任许多国际会议和期刊程序委员会的成员。带领开发和开源的E5系列的文本向量模型已受到广泛关注,总共下载了数百万,并应用于的内部产品线。 #

特殊讲座:大型模型时代的搜索引擎的机会和挑战 #

报告简介:近年来,由GPT代表的大型语言模型(LLM)在自然语言处理领域取得了突破性的进步,并逐渐应用于商业搜索引擎。该报告将探讨以下主题:1)搜索系统中大语言模型的应用程序方案,例如查询扩展,文档排序,基于抹布的答案和摘要生成,合成数据等。尤其是长文本建模的问题和推理性能。 2)搜索引擎如何增强大型语言模型,从而提高语言模型生成的可信度和真实时间的性质,以及追踪信息源的能力。 3)将来可能会被大型语言模型颠覆的搜索引擎吗?在这个问题上,我们将大量讨论现有的搜索技术堆栈的可能性,以及大型语言模型在完全替换搜索引擎之前需要解决的研究问题,包括持续的学习和消除幻觉。 #

林·扬凯(Lin )

#

中国人民大学标准化助理教授

#

讲师简介:中国人民大学人工智能学院有前途的助理教授Lin 。主要的研究方向是预培训模型和大型模型智能员。到2024年2月)达到11,938次,在AIS Weier()中国高学者中,H-Index连续三年为41,20120-2022。在今年世界互联网会议上(全球15个项目)在教育部(第三次完成)和世界互联网会议的一等奖中评估了它的成就。就知识而言,其论文被列为其“深入”教科书中的代表性方法。相关工作结果的开源工具包和世界上最大影响力的开源平台上有7,800多个星标。在大型模型智能方面,其主人发布了世界上第一个大型工具学习大型模型。主机发布了大型独立智能车身系统,该系统在开源平台上获得了6,900多个星标。行为的多智能模拟平台是模拟国内外用户行为的第一个多智能平台。 #

特殊讲座:大型模型工具增强功能

#

报告简介:近年来,培训前模型,尤其是大型模型,已成为促进其他人工智能领域中自然语言处理,计算机视觉和进步的关键。但是,尽管这些模型表现出色,但在处理复杂的专业任务时,它们的能力仍然受到限制。这主要是因为这些模型主要取决于学到的知识,并且无法动态获取和使用外部知识,尤其是外部工具。该报告旨在概述工具增加的培训模型的最新发展和应用前景。工具增强的预训练模型可以通过结合外部工具和服务(例如真实时间信息检索,数据分析工具以及专业数据库和工具)来显着改善模型的性能和应用范围。更准确,更丰富的答案,还促进了模型模型的理解和更新。

#

方昆

#

Smart RAG技术领导者

#

演讲者简介: 的RAG( - )技术的领导者Fang Kun在搜索建议领域积累了专业经验,以及和Sogou等顶级公司的大型抹布已有十多年了。

#

主题报告:练习抹布的道路 #

报告简介:随着大语言模型(LLM)的兴起2024年北京结构工程师报名时间及要求,他们在语言理解,产生和逻辑推理方面表现出了出色的能力。但是,如何有效地将这些高级模型与外部知识基础相结合以实现更深层的互补性和优化已成为人工智能领域的关键问题。在这方面,作为一种创新解决方案,搜索增强的生成()技术已被证明可以显着改善模型在特定领域的应用效应,并有效地减轻大型大型常见的“幻觉”问题。这种共享将探讨从行业的角度从实际业务中优化抹布( - )技术的实际情况。我们将详细解释抹布技术的工作原理和实践,包括如何有效地结合搜索机制和生成机制,以优化和提高模型处理复杂信息时的理解和生成能力,并减少模型的幻觉。通过这种分享,我们希望在对受众,如何有效地在行业中使用抹布技术及其未来的发展潜力和可能性,为受众提供全面和深入的了解。 #

冯天 #

大学硕士 #

演讲者:冯迪奥普林,欣豪大学计算机硕士学位。智能光谱AI解决方案以及产品专家和建筑师。在创新研讨会上,非政府组织,遗传分析,零售独角兽和微软等公司都是技术开发和管理工作。擅长探索新技术并将新技术引入传统行业,并将新技术堆栈从零到一。利用大型语言模型设计和开发创新的自然语言信息订阅释放系统,以实现破坏组织边界的异步沟通能力。他在生成AI技术和财务应用以及数字货币方面拥有丰富的经验。 #

主题报告:智能光谱抹布练习尝试 #

报告简介:本报告将以智慧频谱模型引入抹布实践。我们将探讨如何在大型模型上实现抹布系统,包括使用外部知识库进行信息检索和生成,以及如何通过培训和优化来提高回忆性能。

#

王南

#

Jina Ai Co -兼首席技术官

#

讲师资料:Jina AI的合作创始人兼首席技术人员Wang Nan。他专注于自然语言处理和搜索领域中机器学习和深度学习算法的研究。博士学位毕业于德国的Bohon ,并获得了计算神经科学的博士学位。 Wang Nan博士致力于促进AI技术在自然语言处理和搜索领域的实际应用。他曾在著名的欧洲电子商务公司和腾讯中担任搜索和自然语言处理的高级算法工程师。他积极促进了AI技术的开源开发,并积极参与了开源社区的建设。作为核心开发商,Wang Nan博士参与了包括Jina在内的多个主流开源工具的研究和开发,将Jina AI捐赠项目推广到Linux AI&Data,并且是TAC的成员。 2023年,他主持了包括Jina和Jina-在内的多个文本矢量模型的开发和开源,并受到开源社区的广泛关注。该模型的累积下载量超过100万。他为开源社区贡献了40多个技术共享,并于2023年被选为33个开源先驱。

#

主题报告:体系结构,培训和向量模型的未来发展

#

报告简介:随着大型模型的兴起,作为大型模型应用的主要范式,检索和增强发电(RAG)已成为工业和学术研究和讨论中的热点之一。该报告将重点介绍RAG范式的核心技术向量模型,包括以下三个部分:1)矢量模型体系结构:介绍不同模型体系结构和向量模型的进化历史。 2)更深的文本矢量模型培训方法:对于密集的文本矢量模型,扩展了如何培训模型,包括语料库准备,培训过程和评估标准。 3)矢量模型的工业应用和未来开发方向:介绍文本矢量模型的当前开发方向以及多模式矢量模型模型的发展趋势。 #

学术主任

#

Dou #

中国人民大学教授

#

简介:中国人民大学帕伦顿人工智能学院教授,??博客,博客,博客主任,中国计算机协会大数据专家委员会的秘书 - 中国信息学会主任和副主任的秘书。中国信息学会的信息检索委员会。主要的研究方向是人工智能,智能信息检索,自然语言处理等。他在国际著名的学术会议和期刊上发表了100多篇论文。 AIRS 2012)最佳纸张奖,国家信息检索学术会议(CCIR 2023,CCIR 2023)最佳纸张奖,等等。

#

时间:5月24日至26日,2024年

#

地址:北京科学院一楼的报告厅(北京海迪安村的中瓜学院南路6号,北京大学) #

沿北京地铁线第10行,下车离开A港“ 站”,然后步行10分钟。

#

注册通知:

#

1。注册费:CCF成员2800 Yuan,非成员3600元。快来和旅馆运输(费用)照顾好自己。根据付款顺序,会员优先级的原则在金额已满之前被录取。根据某些学生的要求,此问题在此问题中同时存在,在线和离线注册是相同的。在线会议室编号和密码将在会议前1天通过电子邮件发送。 #

2。注册截止日期:2024年5月22日。对于注册,请保留不拦截外部电子邮件的邮箱,例如QQ邮箱。预防措施和微信组QR码将在会议前通过邮件发送。 #

3。咨询邮箱: #

付款方式: #

在注册系统中,通过银行在线支付或转让: #

银行转移(支持在线银行,支付宝):

#

帐户开放:中国商人银行北京子分支机构

#

家喻户晓:中国计算机协会

#

帐户:0701 #

请确保指出:+名称

#

在注册和付款后,付款系统表明付款已完成,即注册成功,通知不会单独通知。 #

注册方法: #

请选择以下两种注册的方法之一:

#

1。扫描(标识)QR码注册: #

2。单击注册链接以注册: #

CCF建议

#

责编:admin 返回顶部  打印

关于我们联系我们友情链接网站声明网站地图广告服务帮助中心