AIGC,ChatGPT以及今天发布的GPT-4
2023年3月18日,DataFunSummit2023:知识图谱在线峰会将试着给你答案!
本次峰会由2位主席与3位专家团成员和6位论坛出品人精心策划而成,共包含了:统一知识表示与复杂推理、大规模知识图谱构建与更新、海量知识存储与计算、知识问答与推荐、知识图谱与AIGC、最佳行业知识图谱实践等6大论坛,邀请20余位来自一线的知识图谱专家学者,进行深度分享交流。本次峰会将全程直播,欢迎大家扫码免费报名收看:
▌峰会日程
▌峰会组织
峰会主席
学术主席:刘铭 哈尔滨工业大学 教授、博士生导师
个人介绍:刘铭,教授/博士生生导师,哈尔滨工业大学计算学部。先后主持国家重点研发计划项目(课题)、国家自然科学基金、中国博士后科学基金特别资助、中国博士后科学基金面上资助一等资助、黑龙江省面上基金、教育部协同育人项目多项基金项目。获黑龙江省科学技术一等奖,哈尔滨市科技成果,第六届全国青年人工智能创新创业大会一等奖。近年来以第一作者或通讯作者发表 CCFA/B 类论文20余篇,包括 TKDE、TOIS、KAIS、IJCAI、ACL 等知名学术刊物或会议上,英文译著一部。担任 NLPCC2020、CCKS2020 知识图谱领域主席,CCKS2019 出版主席、CCKS2021 评测主席、CCKS2022 讲习班主席和 CCKS2023 程序委员会主席。
工业主席:王士进 科大讯飞 AI研究院 常务副院长
专家评审团
洪春涛 蚂蚁集团 图数据库负责人
个人介绍:洪春涛博士于2011年毕业于清华大学计算机系,主要从事并行计算和高性能计算研究;后加入微软亚洲研究院从事分布式系统和大规模机器学习研究;2016年联合创建了北京费马科技有限公司,研发了TuGraph图数据库;2020年加入蚂蚁集团,目前主持蚂蚁图数据库研发。
彭卫华 华为终端 智能决策首席专家
个人介绍:曾在百度、阿里、腾讯等互联网企业工作,长期从事搜索、推荐、自然语言处理、知识图谱等研究工作,在ACL、EMNLP、COLING、KBS等知名学术会议&期刊发表论文20余篇,有着十余年的工业界实战经验。
王昊奋 同济大学 百人计划、特聘研究员、博士生导师
个人介绍:王昊奋,同济大学百人计划,特聘研究员,博士生导师。长期在一线人工智能公司担任CTO之职。他是全球最大的中文开放知识图谱联盟OpenKG发起人之一。他负责参与多项国家级AI相关项目,发表100余篇AI领域高水平论文,被引用次数达到2600余次,H-index达到23。他构建了全球首个可交互养成的虚拟偶像—“琥珀·虚颜”;所构建的智能客服机器人已累计服务用户超过10亿人次。目前,他担任中国计算机学会术语工委副主任,SIGKG主席,上海秘书长,中国中文信息学会理事,语言与知识计算专委会副秘书长,上海市计算机学会自然语言处理专委会副主任,上海交通大学AI校友会秘书长等社会职位。
▌详细介绍
① 统一知识表示与复杂推理
② 大规模知识图谱构建与更新论坛
③ 海量知识存储与计算论坛
出品人:林恒 蚂蚁集团 图数据库开源负责人
个人介绍:2016年联合创立费马科技,主要负责图计算架构与解决方案;2018年10月于清华大学获得博士学位,研究方向为超大规模异构图计算;2020年12月起加入蚂蚁集团,目前负责 TuGraph 开源图数据库。
周研 创邻科技 CTO
个人介绍:浙江创邻科技有限公司联合创始人。分布式数据处理领域技术专家、Apache 开源项目贡献者、图数据库和图计算领域专家、Galaxybase 图数据库产品研发负责人。
演讲题目:基于图数据库的知识图谱存储技术及实践
演讲提纲:
1. RDF 和属性图
2. 图数据库存储的核心目标
3. 图数据库存储的主流方案
4. Galaxybase 图数据库应用实践
听众收益:
1. 图数据库和关系型数据库存储的本质区别是什么?
2. 常见图数据库存储技术方案有哪些?
彭志伟 蚂蚁集团 技术专家
个人介绍:蚂蚁图计算GeaFlow DSL方向负责人,Apache Calcite/Hudi Commiter,多年实时计算和分布式SQL引擎研发经验,目前专注图计算DSL研发方面工作.
演讲题目:蚂蚁金融场景下图表融合分析语言实践
演讲提纲:蚂蚁金融风控等场景对图计算提出了多样化的计算需求,包括实时图计算、离线图仿真等。如何通过一套图分析语言来满足不同场景下的图计算需求是我们面临的重要挑战。我们从实际的业务场景出发,提出并实现了一套图表融合的分析语言,很好的解决了复杂图计算需求,降低了用户使用图计算的门槛。本次分享将介绍图表融合DSL的设计、复杂图查询的分布式化、查询优化以及相关应用务场景介绍等多方面的内容。
听众收益:
1. 了解图计算的典型使用场景
2. 了解图分析语言的现状和面临的挑战
3. 了解蚂蚁图表融合 DSL 解决方案
孙宇熙 Ultipa CEO
个人介绍:高性能计算与存储系统专家、大数据专家、数据库专家及学者;毕业于清华大学计算机科学与技术系和圣塔克拉拉大学计算机工程系;现任Ultipa CEO;曾任EMC(易安信)亚太研发集团 CTO 和中国研究院院长、哈尔滨工业大学客座教授、中国电子学会云计算专家委员会委员、收藏家,哈佛大学美术馆亚洲艺术鉴赏委员会理事;技术科普作家,著有《图数据库原理、架构与应用》《图算法(筹)》《云计算与大数据》《软件定义数据中心》《大数据分析》《银行数字化转型》《程序员生存手册》(The 99 Points of Launching High-Tech Business)等多部中外科技畅销书。
演讲题目:图数据库查询与算法正确性验证
演讲提纲:
· 面对市场上不断涌现的图数据库、知识图谱产品,你想知道它们底层的实现逻辑吗?
· 不同厂家推出的纷繁复杂的评测报告,你知道如何精准地解读吗?
· 你知道如何选型图数据库并进行结果正确性验证码?(显然结果出现错误并非个例,而这会造成一系列问题)
本讲座以无保留、系统化、直观清晰的方式向听众介绍图查询结果的正确性验证方法。
验证方式主要分为三个部分(步骤):
1. 溯源验证:如何通过对源数据下钻来进行结果正确性验证
2. 工具验证:如何通过不同的命令行、可视化操作界面进行验证
3. 编程验证:如何通过图查询与操作语言来进行各类查询(包含算法)的实现与白盒化验证。
掌握这些验证方法后,你会发现很多厂家的图技术产品的查询与分析的实现逻辑、结果,甚至数据建模与入图方式都存在一些问题,而有些问题是根本性与灾难性的,另一些则是需要作为bug来修复—— 而你此时对于图数据库的知识掌握相信已经超越大多数人了。
听众收益:
1. 你知道如何验证图查询与操作的结果是否正确吗?
2. 你知道怎么去分析和评价每家图数据库厂商的评测结果吗?
3. 你知道每个图查询与操作背后的原理与拆解吗?
4. 你知道如何评价与选型图数据库吗?
5. 深入浅出带你揭开图数据库的迷雾
④ 知识问答与推荐论坛
出品人:杜振东 云问科技 NLP 研究院负责人
个人介绍:云问科技NLP研究院负责人,拥有8年机器学习与文本挖掘相关技术经验,6年中文自然语言处理相关项目实战经验。编写书籍《会话式AI》、《人工智能实践录》与《江苏省新兴产业战略丛书-人工智能分册》;参与制定国家人工智能标准化总体组《人工智能标准化与开源研究报告》、《人工智能-术语》、《人工智能-情感计算用户界面框架》;参与制定中国电子工业标准化技术协会《信息技术 人工智能 智能助理智能能力等级评估》;入选国家标准委人工智能专家及AIIA人工智能技术专家。参与百万级用户金融资讯新闻推荐项目,作为算法主要负责人及整体框架设计者,主导全新智能新闻推荐系统的落地,并优化线上推荐算法,整体线上相较原有系统精度提高10%。主要设计面向任务驱动的多轮对话引擎,主导参与搭建NLP底层能力平台,为企业提供底层能力的服务输出。参与多家企业问答机器人系统、知识图谱系统搭建,针对集团型知识管理与问答效果优化有丰富实战经验。
王立玺 中国电子技术标准化研究院 标准创新服务中心 副主任
个人介绍:王立玺,中国电子技术标准化研究院标准创新服务中心标准智能服务研究室负责人/高级工程师。长期从事电子信息技术领域标准科研工作,主持了“电子信息领域标准大数据公共服务平台”、“面向疫情防控和复产复工的标准知识图谱智能服务平台研发和应用”等多项省部级科研项目。近年来,主要致力于标准数字化、标准知识图谱相关理论、技术、应用研究,突破了一系列关键技术。授权《标准知识图谱构建、标准查询方法及装置》等标准知识图谱相关专利5项,软件著作权十余项。
演讲题目:标准数字化关键路径–标准知识图谱的构建与应用
江悦 阿里巴巴 算法工程师
个人介绍:2020年毕业于南京大学,同年加入阿里巴巴担任算法工程师,在企业智能事业部负责搜索 Query 理解相关工作。
演讲题目:基于知识增强和预训练大模型的 Query 意图识别
演讲提纲:
1. 基于知识增强和预训练大模型的 Query 意图识别的场景
2. Query 意图识别架构介绍
3. 基于知识增强和预训练大模型的 Query 意图识别
4. 总结&思考
听众收益:
1. 了解企业级搜索的 QP 建设
2. 如何基于知识增强进行超短文本 Query 的意图识别
3. 基于预训练大模型的 Query 意图识别实践
李亮 百度智能云AI应用产品部 解决方案总监
个人介绍:从事电网和发电行业信息化工作10+年,具有丰富的电网调度、电力交易、发电场站智慧化建设整体规划和项目管理经验,目前主要负责百度知识中台在能源方向的整体解决方案。
演讲题目:基于知识图谱、NLP与大模型技术的企业智能搜索与知识应用平台建设
演讲提纲:
1. 百度对知识中台的理解和观点
2. 百度知识中台整体解决方案
3. 基于知识中台的应用场景
听众收益:
1. 如何通过知识体系建设助力企业数字化转型
2. 知识中台重要建设过程和核心技术点
3. 知识中台的典型应用场景和行业案例
桑海龙 58同城 AI Lab 算法资深工程师
个人介绍:桑海龙,58同城 TEG-AI Lab 算法资深工程师,智能客服算法负责人,2019年10月加入58同城,一直从事智能客服算法研发工作,本硕毕业于哈尔滨工业大学,2017年7月毕业后校招加入猎豹移动,从事对话算法工作。
演讲题目:招聘平台下的对话机器人技术实践
演讲提纲:微聊和电话是58同城招聘平台上 C 端求职者和 B 端招聘者的关键连接手段,C 会主动给 B 发起微聊,系统也会通过微聊渠道把一些B端职位推送给 C 端用户(称为反向邀约)。我们将对话机器人应用在上述场景,当 B 不在线时和 C 多轮对话,进行人岗匹配和求职意向判断,若 C 高意向,会利用智能双呼能力(即先由机器人智能外呼提醒 B,B 若同意转接 C,机器人自动外呼 C,然后 BC 电话直连)来促成 BC 的电话连接。本次分享将围绕对话机器人技术在招聘平台的应用展开,包括 QABot 自动问答、TaskBot 多轮引导、对话完成后用户求职意向识别等算法,以及智能双呼能力的应用;此外,我们在问答、求职意向识别等场景实验了 ChatGPT 的应用效果,并与线上模型进行了对比。
听众收益:
1. 招聘场景下对话机器人技术体系的构建
2. 对话机器人中各技术模块的实现
3. ChatGPT 技术的相关探索实验
赵骥 货拉拉 算法专家
个人介绍:多年 LBS 场景搜索推荐经验。
演讲题目:LBS 场景下数据图谱在搜索推荐的应用
演讲提纲:
1. 介绍 LBS 场景下数据图谱
2. 介绍 LBS 数据图谱在搜索应用
3. 介绍 LBS 数据图谱在推荐应用
听众收益:
1. 了解 LBS 数据图谱价值
2. 了解 LBS 场景搜索推荐利用数据图谱优化应用
⑤ 知识图谱与AIGC论坛
出品人:付瑞吉 快手 MMU 知识图谱中心负责人
个人介绍:快手 MMU 知识图谱中心负责人,本硕博毕业于哈工大,中科大博士后,高级工程师。曾担任科大讯飞 AI 研究院副院长,获吴文俊人工智能科技进步奖一等奖。研究方向包括知识图谱、智慧教育等,在 ACL、EMNLP、Coling、IJCAI、TASLP 等国际会议和期刊上发表学术论文多篇,申请(获得)国家发明专利50余项。在科大讯飞期间,曾研发智能评阅技术,在多地中高考、CET 等大规模考试阅卷中应用;主持研发的个性化学习技术应用于讯飞学习机等多款教育产品中。2021 年加入快手,主持研发业界首个亿级别多模态短视频百科体系“快知”。
冯骁骋 哈尔滨工业大学 副教授/博导
个人介绍:冯骁骋,哈尔滨工业大学计算学部社会计算与信息检索研究中心副教授、博导。智能科学与技术系副主任。研究兴趣包括自然语言处理、文本生成、机器翻译等。在ACL、AAAI、IJCAI、TKDE、Chinese Science等CCF A/B类国际会议及期刊发表论文30余篇。据Google学术统计,论文引用数量超过2800次,一篇论文入选Paper Digest EMNLP 2020 Top Ten 高引论文。担任NIPS、ICML、AAAI、IJCAI、ACL等国际会议程序委员会高级/普通成员;中国中文信息学会自然语言生成与智能写作专委会副秘书长、中国计算机协会哈尔滨YOCSEF副主席等。与华为、腾讯、科大讯飞、微软等国际一流互联网公司保持长期科研合作关系。
演讲题目:面向结构化数据的文本生成技术研究
演讲提纲:近年来,随着深度学习方法的快速发展,文本生成技术也由科学研究走向了实际应用。目前,文本生成任务形式相对多样,包括:自动文摘、对话生成、风格迁移、结构化数据描述生成和多模态数据描述生成等,各个任务之间既存在一些任务驱动的特殊表示和规则也包含相对通用的技术路线和方法。本次讲解将在简要介绍文本生成任务的基础上重点围绕面向结构化数据的文本生成技术进行讲解,包括结构化数据的建模,知识的引入和不同知识的使用方式。期望本次报告对知识驱动的文本生成技术感兴趣的相关听众有所帮助。
李丕绩 南京航空航天大学 教授
个人介绍:李丕绩,南京航空航天大学计算机科学与技术学院/人工智能学院教授,博士生导师,2021年度南京航空航天大学”长空学者”获得者。香港中文大学博士,曾任腾讯AI Lab自然语言处理中心高级研究员。研究方向主要为自然语言处理,包括预训练模型、文本摘要、文本生成和对话系统。曾经在相关领域顶级会议如ACL、EMNLP、SIGIR等发表学术论文60余篇。多次受邀担任ACL、EMNLP、EACL、IJCAI等会议的领域主席。在工业界工作期间负责了多个语言理解、文本生成和智能对话相关重要项目的算法研发和产品发布,有丰富的科研落地实践经验。主持或参与多项国家自然科学基金、CCF-腾讯犀牛鸟基金、CCF-智谱大模型基金等项目。
演讲题目:知识桥接的文本生成算法
演讲提纲:虽然基于神经网络的对话系统已经取得了很大的进步,但是现有模型的成功仍然建立在基于大量训练数据的模式刻画和描述上面,在一些特定的应用场景中表现出知识表达运用和逻辑推理能力较弱的缺点,从而导致模型可解释性差、可控性低、容错能力弱等特点。调研发现,通过向神经网络中融入符号化的知识可以缓解上述这些问题,增强对话生成的质量。所以,我们探索了神经符号计算方式来进一步提升对话系统性能的可行性,具体包括开放文本到符号知识的抽取生成、符号语义表示学习和推理模型、符号推理约束的可控解码等策略。实验也表明所探究思路确实在对话系统和文本生成任务中能取得不错的结果。
李直旭 复旦大学 研究员、博导
个人介绍:李直旭,复旦大学计算机科学技术学院研究员、博士生导师,上海市数据科学重点实验室主任助理,复旦大学知识工场实验室执行副主任,曾兼任科大讯飞苏州研究院副院长,博士毕业于澳大利亚昆士兰大学,主要研究方向为认知智能与知识工程、多模态知识图谱、大数据分析与挖掘等。在领域主流期刊和国际会议上发表论文150余篇,主持十余项国家和省部级科研项目。
演讲题目:AIGC 时代的多模态知识工程思考与展望
演讲提纲:ChatGPT 的火爆出圈使得 AI 生成(AIGC)技术受到了全社会前所未有的广泛关注。此消彼长之下,传统的知识工程遭受了诸多质疑。在多模态智能领域,AIGC 的能力不断提升,多模态知识工程工作应该何去何从?是否仍有价值?在本次分享中,讲者将探讨当前 AIGC 技术耀眼“光芒”背后的“暗面”,思考与展望 AIGC 时代的多模态知识工程研究。
听众收益:
1. AIGC 时代的知识工程是否仍具价值?
2. 多模态知识工程工作应何去何从?
3. 多模态智能的实现路在何方?
王文广 达观数据 副总裁
个人介绍:王文广,达观数据副总裁,高级工程师,人工智能标准编制专家,自然语言处理和知识图谱著名专家,《知识图谱:认知智能理论与实战》作者,专注于AI 大工程、知识图谱、认知智能、自然语言处理、图像与语音分析、大数据和图分析等人工智能方向。现在是上海市人工智能标准化技术委员会委员,上海科委评审专家,中文信息学会(CIPS)语言与知识计算专委会委员,中国计算机学会(CCF)高级会员,中国人工智能学会(CAAI)深度学习专委会委员。曾获得多个国际国家级、省部级、地市级奖项,拥有数十项人工智能领域的国家发明专利和会议、期刊学术论文。在达观数据致力于将自然语言处理、知识图谱、计算机视觉和大数据技术产品化,以OCR、文档智能处理、知识图谱、RPA等产品服务于金融、智能制造、贸易、半导体、汽车工业、航空航天、新能源、双碳等领域。
演讲题目:神经网络大模型 ⊕ 知识图谱 ⊕ 强化学习 = AGI(通用人工智能)
演讲提纲:以人为本AGI :就是以人类为中心的通用人工智能,或者说人工智能是以服务人类为目的的,有名的“机器人三定律”说的也是这个。人工智能发展至今,已经出现了能够将神经网络大模型、知识图谱 、强化学习三者融合的系统(产品),而这已经隐隐散发出一点 AGI 的曙光,或者称之为婴儿期的 AGI。在这个节点往后,类似军备竞赛一样的投入研究和持续发展,曙光终究会成为朝阳,而婴儿也会茁壮成长!本次演讲围绕 神经网络大模型 ⊕ 知识图谱 ⊕ 强化学习 = AGI 方面的观点和思考,与大家一起交流。
听众收益:
1. ChatGPT、Google Bard 等AI 江湖的倚天屠龙记
2. AGI 曙光初现
3. AGI 范式探讨
⑥ 最佳行业知识图谱实践论坛
出品人:孙常龙 达摩院 资深算法专家
个人介绍:孙常龙,现任达摩院-语言技术实验室-应用算法 团队负责人。拥有多篇授权专利,在顶级会议发表论文30余篇,承担国家科技部重点研发项目多项,带领团队在多项的国内外评测比赛中获得第一名,获得2022年世界互联网领先科技成果奖、2022年度高等学校科学研究优秀成果奖(科学技术)科技进步一等奖。研究方向包括机器学习、自然语言理解、文档理解等。在技术赋能业务方面,深入司法、通信、互联网等垂直领域的智能化建设,首创了司法全流程智能化审判系统,该智审模式2022年纳入社科院《法制蓝皮书》,已经落地多家法院。
孙佩霞 中国电信研究院 智行云网大脑技术负责人
个人介绍:主要负责网络运营知识图谱建设,图谱检索,推荐,对话机器人,网络运营大模型相关技术架构。参与过IEEE P2807知识图谱国际标准撰写。国家知识图谱标准撰写,AIIA大模型,智能决策标准撰写。
演讲题目:电信网络运营事件知识图谱构建
演讲提纲:介绍电信网络运维领域事件知识图谱构建,知识图谱检索推荐,知识交互等应用。主要内容包括:
1. 电信网络运营场景介绍
2. 网络运营知识图谱构建
3. 网络知识图谱业务应用
4. 展望
听众收益:
1. 通过网络运营事件知识图谱刻画运维全周期,提升运维效率,并实现知识结构化沉淀。
2. 探索网络场景和知识图谱进一步结合使用,提升网络自智水平。
赵登 蚂蚁集团 算法专家
个人介绍:博士,负责蚂蚁集团知识图谱平台算法能力建设和业务支持。
演讲题目:金融知识图谱的推理与应用
演讲提纲:知识图谱作为一种新的数据管理模式越来越受到行业的重视,它通过图结构与知识语义对客观世界进行建模,定义实体之间的语义关联,提供辅助的推理和决策,与金融、公安等领域的结合创造了巨大的市场空间。过去几年,蚂蚁知识图谱平台结合金融多元业务场景构建领域知识图谱,围绕控风险、促增长核心命题持续和业务深度合作,在这个过程中也沉淀了支撑多业务领域的企业级知识图谱架构和算法推理工具。主要内容包括:
1. 介绍知识图谱的业界发展趋势;
2. 介绍蚂蚁知识图谱的核心能力;
3. 介绍蚂蚁金融知识图谱在各个场景中的应;
4. 对蚂蚁知识图谱未来发展的展望。
听众收益:
1. 了解金融知识图谱的特点和核心能力
2. 了解金融知识图谱如何在各领域发挥应用价值
宋凯嵩 达摩院 算法专家
个人介绍:东北大学计算机软件与理论专业博士,18年加入阿里巴巴达摩院(杭州)科技有限公司,从事情感分析、内容审核、知识图谱等相关技术的研究和产品研发。独立或合作在 AAAI、IJCAI、SIGIR、WWW、TKDE 等顶级学术会议和期刊发表论文30余篇。
演讲题目:企业知识图谱的构建及业务应用
演讲提纲:通过整合企业及企业关联信息,挖掘海量互联网数据,运用智能分析算法,构建企业知识图谱,全方位洞悉企业信息,帮助企业在风险控制、企业营销、市场监测等领域打造智能企业级应用。
听众收益:
1. 企业图谱的特点?
2. 如何构建企业图谱?
3. 如何把企业图谱应用在下游业务?
赵新颜 达摩院 高级算法工程师
个人介绍:阿里巴巴达摩院高级算法工程师,博士毕业于中国科学技术大学,研究方向为知识图谱,自然语言生成,对话系统,在CCF A类会议,SCI 1区期刊发表相关论文多篇。
演讲题目:知识图谱在法律领域的研究与实践
▌关于我们
DataFun:专注于大数据、人工智能技术应用的分享与交流。发起于2017年,在北京、上海、深圳、杭州等城市举办超过100+线下和100+线上沙龙、论坛及峰会,已邀请超过2000位专家和学者参与分享。其公众号 DataFunTalk 累计生产原创文章900+,百万+阅读,16万+精准粉丝。
原文链接:http://it.taocms.org/03/117275.htm&wd=&eqid=a8366dff00022fb30000000364472676&wd=&eqid=cbe9c816002173c00000000264561211