如何在OCR实时识别中过滤并显示预设关键词_技术教程

本文介绍如何在android ocr应用中，从识别出的文本中精准筛选出预定义关键词列表中的匹配项，并仅将这些匹配词（或其组合）显示在textview中，避免无效

循环和作用域错误。

在OCR实时识别场景中（如使用ML Kit或Firebase ML Vision），receiveDetections() 回调会持续返回识别出的文本块（TextBlock）。原始代码将所有识别内容拼接后直接显示，但实际业务常需白名单过滤——即仅展示预设关键词（如 "abc"、"login"、"error" 等），其余内容忽略。

你遇到的问题核心在于两处关键错误：

作用域错误：stringBuilder 是 run() 内部的局部变量，无法在外部 while 循环中访问；
逻辑混乱：while (textView.getText().toString().trim().length() == 0) 是忙等待式阻塞，既无意义又易导致ANR；且 list.contains(stringBuilder) 试图用 StringBuilder 对象去匹配 String 列表，类型不兼容，永远返回 false。

✅ 正确做法是：在拼接完全部识别文本后，立即进行关键词匹配与过滤，再设置 TextView。以下是优化后的完整实现：

@Override
public void receiveDetections(Detector.Detections detections) {
    final SparseArray items = detections.getDetectedItems();
    if (items.size() == 0) return;

    // Step 1: 拼接所有识别文本（保留换行便于阅读）
    StringBuilder fullText = new StringBuilder();
    for (int i = 0; i < items.size(); i++) {
        TextBlock item = items.valueAt(i);
        fullText.append(item.getValue()).append("\n");
    }
    String rawResult = fullText.toString().trim();

    // Step 2: 定义关键词白名单（建议声明为成员变量，避免重复创建）
    List keywords = Arrays.asList("abc", "login", "submit", "cancel"); // 示例

    // Step 3: 提取所有匹配的关键词（支持子串匹配，区分大小写可按需调整）
    StringBuilder filtered = new StringBuilder();
    for (String keyword : keywords) {
        if (rawResult.toLowerCase().contains(keyword.toLowerCase())) {
            if (filtered.length() > 0) filtered.append("\n");
            filtered.append(keyword);
        }
    }

    // Step 4: 更新UI（必须在主线程）
    textView.post(() -> textView.setText(filtered.toString().isEmpty() 
        ? "No keywords detected" 
        : filtered.toString()));
}

? 关键注意事项：