真灼财经2023年10月9日讯,香港中文大学贾佳亚带领的研究团队,近日联同美国麻省理工大学团队,发布革命性超长文本扩展技术LongLoRA,大大扩展大语言模型的上下文窗口,允许模型考虑和处理较长的文本序列,首次解决全球大语言模型对话缺陷。
过往,以AI小区著名的开源大语言模型为例,LLaMa支持2k tokens的文本长度、Llama2也仅仅支持4k tokens的文本长度。透过LongLoRA,用家只需要两行代码以及一台8卡A100机器,便可以将7B模型的文本长度拓展到100k tokens,70B模型的文本长度拓展到32k tokens,意味数十页论文、数百页报告以至鸿篇巨制,不再成为大模型盲区。研究团队亦基于LongLoRA技术,同步发布全球首个拥有70B参数量的长文本对话大语言模型LongAlpaca。
目前,LongLoRA技术和LongAlpaca已开源,并大获用家欢迎,迅速登上Hugging Face热榜第一名、Paperwithcode热度第一名、Github全部Python项目热度第五名,并在Github Stars一周内破千。
贾佳亚是香港中文大学终身教授、电气与电子工程师协会(IEEE)会士,计算器视觉、人工智能与计算器影像学等领域顶尖专家,全球计算器视觉和人工智能领域顶级期刊《TPAMI》首位视觉领域华人副主编、《IJCV》编委,拥有广泛的国际影响力。贾博士在2019年创立思谋科技,总部位于香港科学园,是专注于智能制造领域的标准软硬一体化产品及解决方案供货商,是香港有名的独角兽公司。