【认知】梳理中国AI法律大模型都有哪些？

合乐888在线文章详细信息

首页知识中心【认知】梳理中国AI法律大模型都有哪些？

【认知】梳理中国AI法律大模型都有哪些？

2024年07月22日

合乐888在线

　　一大模型的定义什么是通用大模型？通用大模型是指能够在多个领域和任上表现良好的人工智能模型，通常采用深度学的方法，利用海量的数据进行预训练和微调，以提高模型的泛化能力和语言理解能力。通用大模型的代表有OpenAI公司的GPT系列Google公司的BERT系列内清华的ChatGLM等。什么是法律大模型？法律大模型是指专门针对法律领域的人工智能模型，它在通用大模型的基础上，使用高质量的法律数据进行微调，以提高模型在法律问答文本生成案例分析等任上的专业性和准确性。法律大模型的代表有LexiLaw幂律等。二目前开源的法律大模型1LawGPTzh 文法律大模型獬豸开源地址链接项目简介利用ChatGPT清洗CrimeKgAssitant数据集得到52k单轮问答我们根据华人民和法律手册上最核心的9k法律条文，利用ChatGPT联想生成具体的情景问答知识问答使用ChatGPT基于文本构建QA对2LaWGPT基于文法律知识的大语言模型开源地址链接在通用文基座模型如 ChineseLLaMAChatGLM 等的基础上扩充法律领域专有词表大规模文法律语料预训练，增强了大模型在法律领域的基础语义理解能力。在此基础上，构造法律领域对话问答数据集司法考试数据集进行指令精调，提升了模型对法律内容的理解和执行能力。3Lawyer LLaMA开源地址链接北大团队出品，法律指令微调数据集咨询法律考试对话进行指令微调。Lawyer LLaMA 首先在大规模法律语料上进行了continual pretraining，让它系统的学的法律知识体系。在此基础上，借助ChatGPT收集了一批对家统一法律职业资格考试客观题以下简称法考的分析和对法律咨询的回答，利用收集到的数据对模型进行指令微调，让模型得将法律知识应用到具体场景的能力。4LexiLaw 文法律大模型开源地址链接LexiLaw 是一个经过微调的文法律大模型，它基于 ChatGLM6B 架构，通过法律指令微调数据集问答书籍概念解释，法条内容进行指令微调。三目前法律大模型的技术难点？法律大模型面临着多方面的技术挑战，主要包括以下几个方面数据获取和处理法律数据具有专业性结构性时效性等特点，需要进行有效的收集清洗标注组织等工作，以保证数据的质量和可用性。模型训练和优化法律大模型需要在通用大模型的基础上进行针对性的微调，以适应法律领域的特殊需求，同时需要考虑模型的收敛性稳定性可解释性等因素，以提高模型的效率和可信度。法律遵循和风险控制法律大模型需要遵守相关的法律规范和伦理原则，尊重用户的隐私和权益，防止模型生误导歧视侵权等不良后果，同时需要提供合理的免责声明和使用提示，以降低潜在的法律风险。

　　四法律大模型的应用场景1法律咨询服法律大模型可以通过对话的方式，为用户提供针对具体法律问题的咨询和建议，例如合同咨询合同起草合同审查合同信息抽取等。法律大模型可以根据用户的输入，提供详细和准确的回答，并给出相关的法律依据和解释。2法律文书生成法律大模型可以利用其强大的文本生成能力，帮助用户起草各种法律文书，如判决书裁定书诉状答辩状合同等。法律大模型可以根据用户提供的关键信息，生成符合法律规范和格式的文书，并提供必要的修改和优化建议。3法律知识发现法律大模型可以利用其深厚的法律知识和理解能力，帮助用户发现和挖掘有价值的法律知识，如法律条款判例案例分析等。法律大模型可以根据用户的查询，从海量的法律文本检索出相关的内容，并进行归纳和总结。4法律智能监督法律大模型可以利用其强大的数据分析和推理能力，帮助用户进行法律智能监督，如线索管理线索评估线索分流线索交办线索督办线索协同办理线索分析等。法律大模型可以根据用户的需求，实现线索的办理管控线索享与应用线索应用成效分析等功能。

　　欢迎关注AI演进并加入AI演进社群