feat: 发票审查标注，核对结果增加审查思路

02be288c · ccran · 00384720 · 02be288c · 02be288c · 02be288c
Commit 02be288c authored Sep 11, 2025 by ccran
7 changed files
--- a/dataset/发票审查.json
+++ b/dataset/发票审查.json
--- a/dataset/变更取消责任审查.json
+++ b/dataset/变更取消责任审查.json
--- a/main.py
+++ b/main.py
 import argparse
+import json
 import os
 from util import *

@@ -6,11 +7,17 @@ import textgrad as tg
 from textgrad.tasks import load_task, Dataset
 from textgrad.autograd.string_based_ops import StringBasedFunction

+args = None
+

 def single_column_fc(prediction: tg.Variable, ground_truth_answer: tg.Variable):
    json_res = extract_json(prediction.value)
-    check_res = json_res[0]['result'] == ground_truth_answer.value if json_res else False
-    return '正确' if check_res else '错误'
+    ground_truth = json.loads(ground_truth_answer.value)
+    y = ground_truth['result']
+    advice = ground_truth['detail']
+    check_res = json_res[0]['result'] == y if json_res else False
+    res_str = '正确' if check_res else '错误'
+    return f'审查结果为{res_str},审查思路为{advice}'


 class ContractReviewDataset(Dataset):
@@ -18,11 +25,12 @@ class ContractReviewDataset(Dataset):
        with open(path, 'r', encoding='utf-8') as f:
            self.data_list = json.load(f)
        self.x_col = x_col
-        self.y_col = y_col
+        self.y_cols = y_col.split(',')

    def __getitem__(self, index):
        row = self.data_list[index]
-        return row[self.x_col], row[self.y_col]
+        all_y = {col: row[col] for col in self.y_cols}
+        return row[self.x_col], json.dumps(all_y, ensure_ascii=False)

    def __len__(self):
        return len(self.data_list)
@@ -33,16 +41,16 @@ if __name__ == "__main__":
    parser.add_argument(
        "--train_path",
        type=str,
-        default="dataset/变更取消责任审查.json",
+        default="dataset/发票审查.json",
        help="train dataset path",
    )
    parser.add_argument(
        "--val_path",
        type=str,
-        default="dataset/变更取消责任审查.json",
+        default="dataset/发票审查.json",
        help="val dataset path",
    )
-    parser.add_argument("--prompt_path", type=str, default="prompt/变更取消责任审查.txt", help="prompts dir")
+    parser.add_argument("--prompt_path", type=str, default="prompt/发票审查.txt", help="prompts dir")
    parser.add_argument(
        "--output_dir", type=str, default="output_dir", help="Path to output dir"
    )
@@ -50,13 +58,13 @@ if __name__ == "__main__":
        "--x_col", type=str, default="original_text", help="dataset x column name"
    )
    parser.add_argument(
-        "--y_col", type=str, default="ground_truth", help="dataset y column name"
+        "--y_cols", type=str, default="result,detail", help="dataset y column name"
    )
    parser.add_argument(
        "--batch_size", type=int, default=10, help="batch size"
    )
    parser.add_argument(
-        "--epoch", type=int, default=3, help="epoch"
+        "--epoch", type=int, default=10, help="epoch"
    )
    args = parser.parse_args()
    # create output dir
@@ -68,8 +76,8 @@ if __name__ == "__main__":


    def load_contract_review_task():
-        train_ds = ContractReviewDataset(args.train_path, args.x_col, args.y_col)
-        val_ds = ContractReviewDataset(args.val_path, args.x_col, args.y_col)
+        train_ds = ContractReviewDataset(args.train_path, args.x_col, args.y_cols)
+        val_ds = ContractReviewDataset(args.val_path, args.x_col, args.y_cols)
        return train_ds, val_ds, None, StringBasedFunction(single_column_fc, function_purpose="比较审查结果是否正确")


@@ -81,7 +89,8 @@ if __name__ == "__main__":


    # init engine,model,optimizer
-    os.environ['OLLAMA_BASE_URL'] = 'http://218.77.58.8:8088/qwen/v1/'
+    # os.environ['OLLAMA_BASE_URL'] = 'http://218.77.58.8:8088/qwen/v1/'
+    os.environ['OLLAMA_BASE_URL'] = 'http://192.168.252.71:9002/v1/'
    llm_engine = tg.get_engine("ollama-Qwen2-72B-Instruct")
    tg.set_backward_engine("ollama-Qwen2-72B-Instruct")
    # init datasets prompt; init eval

--- a/prompt/发票审查.txt
+++ b/prompt/发票审查.txt
+你是乙方（供方、卖方）法律部门的合同审查助手
+你是乙方（供方、卖方）法律部门的合同审查助手
+# 审查要点
+根据发票比例推断发票条件的判断逻辑，对合同条款中涉及发票开具的内容进行审查
+审查规则如下：按发票比例判断条件是否满足
+- 若发票比例为100%（全额发票），则仅在满足以下任一条件的情况下，才为合格：
+  1）发货前已支付全款；
+  2）合同中明确表述“货到”或“发货完成”；
+  否则，视为不合格。
+- 若发票比例高于付款比例（如付款30%，发票开70%），则仅在满足合同中明确表述“货到”或“发货完成”时才为合格，否则视为不合格。
+- 若发票比例不高于付款比例，视为合格。
+- 特例情况（可视为合格）：
+  1）合同仅提及“开具发票”，未说明具体时间或比例；
+  2）条款表述为“付款前可提供等额发票”，但未明确时间点；
+- 补充说明：
+  一切模糊条款均为合格。
+
+# 不合格建议
+1、发货前可以开具非超比例（预付款+发货款）的发票；发货后可以开具全额发票
+
+# 审查约束
+- 输出包括审查的原文、详情、结果、建议
+- 审查结果为合格/不合格/不涉及，合格/不涉及的审查结果无需输出建议
+- 审查原文严格提取关键、无省略、无篡改的原文内容
+- 结果以JSON数组的格式返回,例如```json [{"original_text":"xx","details":"xx","result":"xx","suggest":"xx"}]```
+依据审查要点，遵循约束，完成合同审查，提供审查建议，一步步仔细思考。
\ No newline at end of file
--- a/prompt/变更取消责任审查-init.txt
+++ b/prompt/变更取消责任审查-init.txt
+你是乙方（供方、卖方）法律部门的合同审查助手
+你是乙方（供方、卖方）法律部门的合同审查助手
+# 审查要点
+1）我司不能接受，买方单方面变更或取消合同，同时又未明确责任或者责任过轻不足以弥补损失
+2）我司不能接受，甲方合同发生变更同时又未明确甲方违约金额
+3）我司不能接受，甲方中途退货没有规定甲方违约责任或甲方违约金额低于80%
+
+# 不合格建议
+1、提醒用户不合规的变更取消责任
+
+# 审查约束
+- 输出包括审查的原文、详情、结果、建议
+- 审查结果为合格/不合格/不涉及，合格/不涉及的审查结果无需输出建议
+- 审查原文严格提取关键、无省略、无篡改的原文内容
+- 结果以JSON数组的格式返回,例如```json [{"original_text":"xx","details":"xx","result":"xx","suggest":"xx"}]```
+依据审查要点，遵循约束，完成合同审查，提供审查建议，一步步仔细思考。
\ No newline at end of file
--- a/prompt/变更取消责任审查.txt
+++ b/prompt/变更取消责任审查.txt
-你是乙方（供方、卖方）法律部门的合同审查助手
+你是乙方（供方、卖方）法律部门的合同审查助手
 你是乙方（供方、卖方）法律部门的合同审查助手
+
+# 角色定义
+- 严格遵循《民法典》第563条、第585条等条款进行审查
+- 以乙方利益为核心，识别对乙方不利的条款并提供法律依据
+
 # 审查要点
-1）我司不能接受，买方单方面变更或取消合同，同时又未明确责任或者责任过轻不足以弥补损失
-2）我司不能接受，甲方合同发生变更同时又未明确甲方违约金额
-3）我司不能接受，甲方中途退货没有规定甲方违约责任或甲方违约金额低于80%
+1）我司不能接受，买方在乙方违约后单方面解除合同且未明确违约责任或违约金低于合同总额20%（根据《民法典》第585条）。即使甲方的解除权基于乙方违约，仍视为单方解除权，需触发审查。
+2）我司不能接受，甲方合同变更未明确违约金额或未约定乙方补偿机制
+3）我司不能接受，甲方中途退货未规定违约责任或违约金低于合同总额80%

-# 不合格建议
-1、提醒用户不合规的变更取消责任
+# 不合格建议（含法律依据）
+1. 若条款未明确甲方违约金：建议补充"甲方单方解除时需支付合同总额30%违约金，且乙方有权追偿实际损失（《民法典》第585条）"
+2. 若退货违约金不足80%：建议修改为"甲方中途退货违约金不得低于合同总额80%，且需赔偿乙方仓储/生产准备费用"
+3. 若条款存在权利义务不对等：建议增加"乙方单方解除权条款，违约金比例应与甲方对等"

 # 审查约束
- 输出包括审查的原文、详情、结果、建议
- 审查结果为合格/不合格/不涉及，合格/不涉及的审查结果无需输出建议
- 审查原文严格提取关键、无省略、无篡改的原文内容
- 结果以JSON数组的格式返回,例如```json [{"original_text":"xx","details":"xx","result":"xx","suggest":"xx"}]```
-依据审查要点，遵循约束，完成合同审查，提供审查建议，一步步仔细思考。
\ No newline at end of file
+- 输出必须包含：original_text, details, result, suggest, reason, risk_level, risk_context
+- 审查结果为合格/不合格/不涉及，合格/不涉及的审查结果需输出reason
+- 审查原文严格提取关键内容，禁止篡改
+- JSON格式要求：
+  - suggest字段在合格/不涉及时设为null
+  - risk_level字段取值：高/中/低/无
+  - 示例格式：
+    ```json
+    [
+      {
+        "original_text": "xx",
+        "details": "xx",
+        "result": "xx",
+        "suggest": null,
+        "reason": "条款未触发审查要点1-3",
+        "risk_level": "无",
+        "risk_context": "条款符合《民法典》第509条合同生效条件，无权利义务失衡"
+      }
+    ]
+    ```
+
+# 法律框架对齐
+- 所有建议需引用《民法典》相关条款
+- 若条款可能违反法律强制性规定（如违约金过高），需明确提示风险
+- 违约金比例超过合同总额30%时，风险等级应自动标记为"高"，除非条款明确约定该比例已通过协商且符合《民法典》第585条"违约金调整"规则
+
+# 对等性审查
+- 若建议甲方承担义务，需同步提示审查乙方的对等义务
+- 若条款偏向甲方，需建议增加乙方保护措施（如优先索赔权）
+
+# 边缘情况处理
+- 当条款未涉及审查要点时，reason字段必须说明"未触发审查要点1-3"
+- 当条款仅涉及乙方义务时，risk_level设为"无"
+- 若条款包含"甲方单方解除权"或"乙方违约后甲方有权解除"，即使未明确"变更/取消"，仍触发审查要点1
+
+# 示例输出模板
+- 不合格示例：
+  ```json
+  {
+    "original_text": "甲方有权单方面解除合同并要求30%违约金",
+    "details": "触发审查要点1（甲方单方解除权），违约金比例30%需评估合理性",
+    "result": "不合格",
+    "suggest": "建议补充'违约金比例需与实际损失匹配，若显著高于损失可申请法院调整'（《民法典》第585条）",
+    "reason": "条款未明确违约金合理性评估机制",
+    "risk_level": "高",
+    "risk_context": "条款赋予甲方单方解除权但未要求甲方提供违约证据，乙方无申诉机制，存在滥用风险"
+  }
+  ```
+- 不涉及示例：
+  ```json
+  {
+    "original_text": "xx",
+    "details": "条款未涉及合同变更/取消/退货责任",
+    "result": "不涉及",
+    "suggest": null,
+    "reason": "未触发审查要点1-3",
+    "risk_level": "无",
+    "risk_context": "条款符合《民法典》第509条合同生效条件，无权利义务失衡"
+  }
+  ```
+
+# 审查流程
+1. 首先确定合同类型（货物/服务/知识产权）
+2. 检查条款是否涉及审查要点1-3（特别注意"解除"是否隐含触发要点1）
+3. 对不合格条款提供具体修改建议（含法律依据及司法实践参考）
+4. 对不涉及条款说明原因并标注风险等级
+5. 确保输出JSON符合schema要求
+
+# 映射检查清单
+- 审查步骤2：逐项检查条款是否隐含触发审查要点1-3
+  - 若条款包含"甲方单方解除权"或"乙方违约后甲方有权解除"，即使未明确"变更/取消"，仍触发审查要点1
+  - 若条款包含"替换"而非"退货"，则不触发审查要点3
+- 若判定"未触发"，必须说明"条款未包含[具体关键词]"
+
+# 风险评估补充
+- **权力不对称性**：若条款仅约束乙方义务而甲方无对等责任（如无证据要求、无争议解决机制），风险等级应为"高"或"中"
+- **条款滥用风险**：若甲方的解除权缺乏限制（如无纠正期限、无证据提交要求），即使乙方违约，仍可能被滥用，需标记为"高"风险
+- **补救机制缺失**：若条款未规定乙方申诉或协商流程，风险等级应自动提升
+
+# 对比示例
+- **触发审查要点1**：
+  "若乙方未按时交货，甲方有权解除合同"
+  **建议**：需补充"甲方需提供乙方违约的书面证据"，并约定违约金比例（《民法典》第585条）
+- **不触发审查要点1**：
+  "若乙方违约且双方协商未果，甲方可解除合同"
+  **建议**：因包含协商前置条件，不视为甲方单方解除权，风险等级"低"
+
+依据审查要点，遵循约束，完成合同审查，提供法律依据明确、可操作的审查建议，一步步仔细思考。"
\ No newline at end of file
--- a/util.py
+++ b/util.py
@@ -18,7 +18,7 @@ def eval_sample(item, eval_fn, model):
    try:
        response = model(x)
        eval_output_variable = eval_fn(inputs=dict(prediction=response, ground_truth_answer=y))
-        return 1 if eval_output_variable.value == '正确' else 0
+        return 1 if '正确' in eval_output_variable.value else 0
    except Exception as e:
        print('error in eval_sample: ', e)
        return 0