Pregunta eliminar el carácter <200b> del archivo de texto


Tengo un gran archivo de texto que contiene esta cadena / carácter <200b> que quiero eliminar. Intenté con sed pero no funcionó.

archivo sed / <200b> // g '

El personaje nunca se muestra cuando abro el archivo con un editor de texto gráfico como gedit, lo veo con vim.


1


origen


Por favor, mira este enlace, me ayudó a encontrar <200b> en mi archivo de texto: unix.stackexchange.com/questions/59447/... - Nanda


Respuestas:


<200b> es un Unicode para espacio de medio ancho. No lo encontrará como una cadena. Puede canalizar el personaje en sed como este para su eliminación:

sed -i "s/$(echo -ne '\u200b')//g" file


1



Bienvenido a superusuario: la respuesta puede ser correcta, pero sería mejor si estuviera rodeada de detalles sobre lo que ha hecho, cómo usar, etc., para personas que quizás no comprendan y busquen respuestas en días o años venideros. - mic84
Hecho. Gracias por la propina y el voto negativo. - sirEgghead
no hubo un voto negativo de mi parte - mic84


Recomendaría abrir este archivo en cualquier editor de texto y hacer una búsqueda y reemplazo.

Buscar: mantener Alt y prensa 0  1  2  9 (Esto ingresará un carácter de ancho cero).

Reemplazar: dejar en blanco.

Elija "Reemplazar todo".


0



Dependiendo de qué tan "grande" sea el archivo de texto, algunos editores de texto no funcionarán en él. - mpez0
Hola. Ya probé esto pero me dice que la cadena no se encuentra. El archivo tiene 5 millones de líneas. - user2598997
Debe detectar cómo ingresar el mismo símbolo que se utiliza en este archivo. Y luego use la herramienta FART o Ser (ya que su archivo es realmente enorme) para buscar y reemplazar. No veo otra opción, pero eso no significa que no exista. Veamos si alguien publicará algo más efectivo. - Mike
Necesito agregar una información. el personaje nunca se muestra cuando abro el archivo con un editor de texto gráfico, lo veo con vim. - user2598997