Flutter for OpenHarmony:diacritic 移除重音符号,实现精准的模糊搜索与排序(文本规范化处理) 深度解析与鸿蒙适配指南

Flutter for OpenHarmony:diacritic 移除重音符号,实现精准的模糊搜索与排序(文本规范化处理) 深度解析与鸿蒙适配指南

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net

在这里插入图片描述

前言

全球化应用经常需要处理包含各种重音符号(Accent)和变音符号(Diacritic)的文本,如法语的 “café”、德语的 “München” 或西班牙语的 “mañana”。如果不进行处理,用户在搜索 “cafe” 时可能搜不到 “café”,导致体验极差。

diacritic 是一个专注于解决此类问题的轻量级 Dart 库。它能在几乎不损失语义的情况下,将这些字符转换为其最接近的 ASCII 形式。本文将介绍如何在 OpenHarmony 应用中利用它优化搜索和排序体验。

一、diacritic 简介

1.1 核心功能

  • 移除变音符号:将 à, é, î, ö 等转换为 a, e, i, o
  • 保持语义:尽量寻找视觉或发音相似的替代字符。

1.2 OpenHarmony 适配说明

diacritic 完全用 Dart 编写,无任何平台依赖。它在 OpenHarmony 设备上的运行效果与全平台一致,且性能极快。

用户输入: München

移除变音符

规范化后: Munchen

搜索数据库

命中结果

二、集成与基础用法

2.1 添加依赖

dependencies:diacritic: ^0.1.6 

2.2 基础转换

import'package:diacritic/diacritic.dart';voidmain(){// 1. 简单替换print(removeDiacritics('café'));// 输出: cafeprint(removeDiacritics('München'));// 输出: Munchenprint(removeDiacritics('Åland'));// 输出: Aland// 2. 混合字符print(removeDiacritics('Héllo Wörld!'));// Hello World!}

三、常见应用场景与示例

3.1 示例一:实现模糊搜索

最常见的场景是做一个忽略重音的搜索功能。

import'package:diacritic/diacritic.dart'; bool searchMatch(String query,String text){// 将查询词和目标文本都规范化为无变音符号的小写形式final normalizedQuery =removeDiacritics(query.toLowerCase());final normalizedText =removeDiacritics(text.toLowerCase());return normalizedText.contains(normalizedQuery);}voidtestSearch(){const dataset =['Sèvres','Céline','Åland','München'];const query ='sev';// 用户输入 "sev"final results = dataset.where((item)=>searchMatch(query, item)).toList();print(results);// [Sèvres]}
在这里插入图片描述

3.2 示例二:各种语言人名排序

直接对包含特殊字符的字符串列表排序往往不符合用户预期。规范化后再排序通常更自然。

import'package:diacritic/diacritic.dart';voidsortNames(){final names =['Élodie','Ezra','Ève','Adam'];// 按照规范化后的字符串排序 names.sort((a, b){returnremoveDiacritics(a).compareTo(removeDiacritics(b));});print(names);// [Adam, Élodie, Ève, Ezra] (E开头的名字现在聚合在一起了)}
在这里插入图片描述

3.3 示例三:生成 URL Slug

将文章标题转换为 URL 友好的格式。

import'package:diacritic/diacritic.dart';StringgenerateSlug(String title){// 1. 移除变音符号var slug =removeDiacritics(title);// 2. 转换为小写 slug = slug.toLowerCase();// 3. 替换非字母数字字符为连字符 slug = slug.replaceAll(RegExp(r'[^a-z0-9]'),'-');// 4. 去除多余连字符 slug = slug.replaceAll(RegExp(r'-+'),'-').trim();return slug;}voidtestSlug(){print(generateSlug('Café & Crème: A Review'));// 输出: cafe-creme-a-review}
在这里插入图片描述

四、完整实战示例:国际化城市搜索

本示例展示一个 OpenHarmony 搜索界面。列表包含世界各地的城市名,用户即便输入不带重音的字符也能精准匹配。

4.1 示例代码

import'package:flutter/material.dart';import'package:diacritic/diacritic.dart';voidmain(){runApp(constMaterialApp(home:CitySearchPage()));}classCitySearchPageextendsStatefulWidget{constCitySearchPage({super.key});@overrideState<CitySearchPage>createState()=>_CitySearchPageState();}class _CitySearchPageState extendsState<CitySearchPage>{// 模拟数据源finalList<String> _allCities =['Zürich','München','São Paulo','Montréal','Bogotá','Curaçao','New York','Paris',];List<String> _filteredCities =[];finalTextEditingController _controller =TextEditingController();@overridevoidinitState(){super.initState(); _filteredCities = _allCities;// 初始显示全部 _controller.addListener(_onSearchChanged);}@overridevoiddispose(){ _controller.removeListener(_onSearchChanged); _controller.dispose();super.dispose();}void_onSearchChanged(){final query = _controller.text;setState((){if(query.isEmpty){ _filteredCities = _allCities;}else{// 核心过滤逻辑 _filteredCities = _allCities.where((city){final normalizedCity =removeDiacritics(city).toLowerCase();final normalizedQuery =removeDiacritics(query).toLowerCase();return normalizedCity.contains(normalizedQuery);}).toList();}});}@overrideWidgetbuild(BuildContext context){returnScaffold( appBar:AppBar(title:constText('Diacritic Search Demo')), body:Column( children:[Padding( padding:constEdgeInsets.all(16.0), child:TextField( controller: _controller, decoration:constInputDecoration( labelText:'搜索城市 (如 munchen, sao paulo)', prefixIcon:Icon(Icons.search), border:OutlineInputBorder(),),),),Expanded( child:ListView.builder( itemCount: _filteredCities.length, itemBuilder:(context, index){final city = _filteredCities[index];returnListTile( leading:constIcon(Icons.location_city), title:Text(city), subtitle:Text('Original: $city -> Normalized: ${removeDiacritics(city)}'),);},),),],),);}}
在这里插入图片描述

五、总结

diacritic 虽然功能单一,但却是提升多语言应用用户体验的利器。在 OpenHarmony 平台上,它无需任何特殊配置即可开箱即用。

最佳实践

  1. 搜索优化:始终在后台对索引和查询词同时应用 removeDiacritics
  2. 数据清洗:在保存用户输入到数据库前,如果主要用于标识用途(如 username slug),建议清理。
  3. 保持原样显示:只在逻辑处理时转换,UI 上仍应展示原始的 München 以尊重用户习惯。

Read more

2025 腾讯广告算法大赛 Baseline 项目解析

2025 腾讯广告算法大赛 Baseline 项目解析

项目概述 2025 腾讯广告算法大赛 Baseline,一个简单的序列推荐系统,主要用于建模用户和物品的交互序列,并利用多模态特征(文本、图像等 embedding)来提升推荐效果。 核心文件功能 1. main.py - 主训练脚本 * 负责模型训练的整体流程 * 包含参数解析、数据加载、模型初始化、训练循环等 * 支持断点续训和仅推理模式 * 使用 TensorBoard 记录训练日志 main.py 代码 import argparse import json import os import time from pathlib import Path import numpy as np import torch from torch.utils.

By Ne0inhk
Flutter 三方库 image_compare_2 的鸿蒙化适配指南 - 实现像素级的图像分块对比、支持感知哈希(pHash)与端侧视觉差异检测实战

Flutter 三方库 image_compare_2 的鸿蒙化适配指南 - 实现像素级的图像分块对比、支持感知哈希(pHash)与端侧视觉差异检测实战

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 image_compare_2 的鸿蒙化适配指南 - 实现像素级的图像分块对比、支持感知哈希(pHash)与端侧视觉差异检测实战 前言 在进行 Flutter for OpenHarmony 的图像处理、自动化 UI 测试或内容防侵权应用开发时,如何科学地判断两张图片是否“相似”?简单的字节对比显然无法处理微小的色差或尺寸缩放。image_compare_2 是一个功能完备的图像对比算法库。它支持从均值哈希(aHash)到分块均方差(MSE)等多种度量算法。本文将指导大家如何在鸿蒙真机上利用该库构建精准的视觉检测链路。 一、原原理性解析 / 概念介绍 1.1 基础原理 image_compare_2 通过将原始图片灰度化、缩小尺寸并进行频域变换(或像素聚合)

By Ne0inhk
【MARL】深入理解多智能体近端策略优化(MAPPO)算法与调参

【MARL】深入理解多智能体近端策略优化(MAPPO)算法与调参

📢本篇文章是博主强化学习(RL)领域学习时,用于个人学习、研究或者欣赏使用,并基于博主对相关等领域的一些理解而记录的学习摘录和笔记,若有不当和侵权之处,指出后将会立即改正,还望谅解。文章分类在👉强化学习专栏:        【强化学习】(47)---《深入理解多智能体近端策略优化(MAPPO)算法与调参》 深入理解多智能体近端策略优化(MAPPO)算法与调参 目录 0 前言 1 MAPPO核心特点 2 On-Policy 和 Off-Policy 2.1. On-Policy 算法 2.2 Off-Policy 算法 对比总结 形象比喻 On-Policy 的小孩 Off-Policy 的小孩 它们的关键区别: 3 MAPPO 是 On-Policy,如何学习历史经验? 4

By Ne0inhk
【数据结构】常见时间复杂度以及空间复杂度

【数据结构】常见时间复杂度以及空间复杂度

时间复杂度与空间复杂度 * 一、复杂度的概念 * 二、时间复杂度 * 1、大O的渐进表示法 * 2、函数clock计算运算时间 * 3、常见复杂度对比 * 3.1常数项复杂度 * 3.2线性时间复杂度 * 案例1 * 案例2 * 3.3平方阶复杂度 * 3.4对数复杂度 * 3.5递归函数 * 单递归 * 双递归 * 三、空间复杂度 * 冒泡排序O(1) * 三个反置O(N) 一、复杂度的概念 * 一个算法的好坏,主要是对比两者的时间和空间两个维度,也就是时间和空间复杂度。 * 时间复杂度主要衡量一个算法运行的快慢,空间复杂度主要衡量一个算法运行需要的额外空间 二、时间复杂度 * 算法的时间复杂度是一个函数式T(N),算法中的基本操作的执行次数,为算法的时间复杂度。 * 注:编译器的不同,编译所需要的时间也不同。越新的编译器,编译的时间往往比旧的编译器快 * 当一个算法函数式为T(

By Ne0inhk