智谱AI开放平台近日宣布,GLM-4-Flash模型正式向公众免费开放。用户只需在bigmodel.cn注册,即可免费构建专属模型和应用,这一举措预计将在AI应用领域掀起新一轮创新浪潮。
GLM-4-Flash模型以其高速和经济性著称,特别适合需要快速响应的简单任务。该模型支持多轮对话、网页浏览、Function Call和长文本推理,覆盖中文、英语、日语、韩语、德语等26种语言。其应用场景广泛,包括科研数据预处理、信息抽取、多语种翻译和多轮对话等。
在技术层面,GLM-4-Flash通过自适应权重量化、并行化、批处理策略和投机采样等方法优化了运行效率,显著降低了推理成本。预训练阶段采用大语言模型筛选数据,获得了超过10T的高质量多语言数据,是ChatGLM3-6B模型的三倍以上。同时,FP8技术的应用大幅提升了预训练效率。
在性能方面,GLM-4-Flash在逻辑推理能力测试中表现出色,生成速度达到72.14token/s(约115字符/s),仅次于GPT-3.5-turbo。此外,模型还具备实时网页检索能力,可快速访问天气、新闻等信息,其函数调用能力与GPT-4相当。
GLM-4-Flash的应用已在多个领域展现潜力。生物学家利用它处理分子数据,探索健康密码;开发者用它生成训练数据,助力其他大模型成长;高校学者制作AI助教,提升学习体验;翻译APP开发者借助它开发儿童英语互动学习工具;广告公司则用它进行文本润色,提高文案效率。
为鼓励用户反馈,智谱AI开放平台还推出了限时免费微调福利:完成调查问卷即可获得500万Tokens(3个月)训练资源包,名额有限,先到先得。