IP 属地广东

王荣胜做不那么容易的事情更有成就感

互联网

澳门理工大学

大数据与物联网

他的动态

赞同了文章2024-04-19 11:09

AttrPrompt：让LLM生成的数据更加多样、更少Bias的一种思路

段誉

武汉大学网络空间安全硕士

引言让LLM生成数据不难，难的是生成高质量的数据。什么叫高质量的数据？以下两点很重要：多样，而不是千篇一律；bias较少，尽量不包含对某些群体的偏见。假设你要生成新闻标题，如果直接写简单的Prompt： 请生成一个有关体育的新闻标题，那么你大概率无法得到高质量的数据。以 智谱清言[1]为例，虽然chatglm能够生成篮球、足球、网球等多类赛事的标题（已经不错了），但仍有以下问题：结构和语气比较类似（多样性低）；主要是…

赞同了回答2024-04-17 17:35

如何看待微软发布的开源大模型WizardLM-2？

金天

腾讯计算机系统有限公司 AI算法专家

先说结论：很强；8x22b应该是mixtral的微调版本，可以pk GPT4老版本，比肩Claude Opus；可能是史上最强的7B（未测）。来看指标：在他们的测试中，7B的胜率可以超过Qwen1.5-14B-Chat，甚至上持平Qwen1.5-32B-Chat。这个效果不得不说很炸裂。应该是目前开源模型里面，效果最强的版本？按照这个走势，开源模型将闭源模型彻底颠覆也不是没有可能。感兴趣的朋友可以测一下该模型的7B版本，如果效果确实牛逼，那可能会在本地模型…

认证与成就

认证信息

澳门理工大学大数据与物联网硕士在读

获得 1,530 次赞同

获得 536 次喜欢，2,763 次收藏

1380

赞助的 Live ⚡️22 关注的话题28 关注的专栏4 关注的问题54 关注的收藏夹0