Cambiar la codificación de salida predeterminada de PowerShell a UTF-8

107
rwallace 2016-10-18 16:54.

De forma predeterminada, cuando redirige la salida de un comando a un archivo o lo canaliza a otra cosa en PowerShell, la codificación es UTF-16, lo cual no es útil. Estoy buscando cambiarlo a UTF-8.

Se puede hacer caso por caso reemplazando la >foo.txtsintaxis con, | out-file foo.txt -encoding utf8pero es incómodo tener que repetirlo cada vez.

La forma persistente de configurar las cosas en PowerShell es colocarlas \Users\me\Documents\WindowsPowerShell\profile.ps1; He verificado que este archivo se ejecuta efectivamente al inicio.

Se ha dicho que se puede configurar la codificación de salida, $PSDefaultParameterValues = @{'Out-File:Encoding' = 'utf8'}pero lo intenté y no tuvo ningún efecto.

https://blogs.msdn.microsoft.com/powershell/2006/12/11/outputencoding-to-the-rescue/ que habla de $OutputEncodingapariencia a primera vista como si debería ser relevante, pero luego habla de salida codificada en ASCII, que no es lo que realmente está sucediendo.

¿Cómo se configura PowerShell para usar UTF-8?

2 answers

166
mklement0 2016-10-18 17:12.

Nota: Lo siguiente se aplica a Windows PowerShell .
Consulte la siguiente sección para conocer la edición multiplataforma de PowerShell Core (v6 +) .

  • En PSv5.1 o superior , donde >y >>son efectivamente alias de Out-File, puede establecer la codificación predeterminada para >/ >>/ a Out-Filetravés de la $PSDefaultParameterValuesvariable de preferencia :

    • $PSDefaultParameterValues['Out-File:Encoding'] = 'utf8'
  • En PSv5.0 o por debajo , que no se puede cambiar la codificación de >/>> , pero, en PSV3 o superior , la técnica anterior hace el trabajo para las llamadas explícitas aOut-File .
    (La $PSDefaultParameterValuesvariable de preferencia se introdujo en PSv3.0).

  • En PSv3.0 o superior , si desea establecer la codificación predeterminada para todos los cmdlets que admiten
    un -Encodingparámetro
    (que en PSv5.1 + incluye >y >>), use:

    • $PSDefaultParameterValues['*:Encoding'] = 'utf8'

Si coloca este comando en sus$PROFILE cmdlets como Out-FileySet-Content usará la codificación UTF-8 de forma predeterminada, pero tenga en cuenta que esto lo convierte en una configuración global de sesión que afectará a todos los comandos / scripts que no especifican explícitamente una codificación.

De manera similar, asegúrese de incluir los comandos en sus scripts o módulos que desea que se comporten de la misma manera , de modo que de hecho se comporten de la misma manera incluso cuando los ejecute otro usuario o una máquina diferente.

Advertencia : ** PowerShell, a partir de v5.1, crea invariablemente archivos UTF-8 _con una (pseudo) BOM _ ** , que es habitual solo en el mundo de Windows - las utilidades basadas en Unix no reconocen esta BOM (ver abajo); consulte esta publicación para conocer las soluciones que crean archivos UTF-8 sin BOM.

Para obtener un resumen del comportamiento de codificación de caracteres predeterminado tremendamente inconsistente en muchos de los cmdlets estándar de Windows PowerShell , consulte la sección inferior.


La $OutputEncodingvariable automática no está relacionada y solo se aplica a cómo PowerShell se comunica con programas externos (qué codificación usa PowerShell cuando les envía cadenas); no tiene nada que ver con la codificación que los operadores de redirección de salida y los cmdlets de PowerShell usan para guardar en archivos.


Lectura opcional: La perspectiva multiplataforma: PowerShell Core :

PowerShell ahora es multiplataforma , a través de su edición PowerShell Core , cuya codificación, sensiblemente, se predetermina a UTF-8 sin BOM , en línea con plataformas similares a Unix.

  • Esto significa que los archivos de código fuente sin una lista de materiales se supone que ser UTF-8, y el uso >/ Out-File/ Set-Contentpor defecto a BOM-menos UTF-8; El uso explícito del utf8 -Encodingargumento también crea UTF-8 sin BOM , pero puede optar por crear archivos con el pseudo BOM con el utf8bomvalor.

  • Si crea scripts de PowerShell con un editor en una plataforma similar a Unix y hoy en día incluso en Windows con editores multiplataforma como Visual Studio Code y Sublime Text, el *.ps1archivo resultante normalmente no tendrá una pseudo-BOM UTF-8:

    • Esto funciona bien en PowerShell Core .
    • Puede fallar en Windows PowerShell , si el archivo contiene caracteres que no son ASCII; Si necesita utilizar caracteres que no sean ASCII en sus scripts, guárdelos como UTF-8 con BOM .
      Sin la lista de materiales, Windows PowerShell (mis) interpreta su secuencia de comandos como codificada en la página de códigos "ANSI" heredada (determinada por la configuración regional del sistema para aplicaciones pre-Unicode; por ejemplo, Windows-1252 en sistemas en inglés de EE. UU.).
  • A la inversa, los archivos que hacen tienen el UTF-8 pseudo-BOM puede ser problemático en Unix-como plataformas, ya que causa utilidades Unix, tales como cat, sed, y awk- e incluso algunos editores tales como gedit- para pasar el pseudo-BOM a través de , es decir, para tratarlo como datos .

    • Esto no siempre puede ser un problema, pero definitivamente puede serlo, como cuando intenta leer un archivo en una cadena bashcon, digamos, text=$(cat file)o text=$(<file)- la variable resultante contendrá la pseudo-BOM como los primeros 3 bytes.

Comportamiento de codificación predeterminado incoherente en Windows PowerShell :

Lamentablemente, la codificación de caracteres predeterminada utilizada en Windows PowerShell es tremendamente inconsistente; la edición multiplataforma de PowerShell Core , como se discutió en la sección anterior, ha puesto fin a esto de manera encomiable.

Nota:

  • Lo siguiente no aspira a cubrir todos los cmdlets estándar.

  • Al buscar en Google los nombres de los cmdlets para encontrar sus temas de ayuda, ahora se muestra la versión PowerShell Core de los temas de forma predeterminada; use la lista desplegable de versiones sobre la lista de temas de la izquierda para cambiar a una versión de Windows PowerShell .

  • En el momento de escribir este artículo, la documentación con frecuencia afirma incorrectamente que ASCII es la codificación predeterminada en Windows PowerShell; consulte este problema de documentos de GitHub .


Cmdlets que escriben :

Out-Filey >/ >>crear archivos "Unicode" - UTF-16LE - por defecto - en los que cada carácter del rango ASCII (también) está representado por 2 bytes - que difiere notablemente de Set-Content/ Add-Content(ver el siguiente punto); New-ModuleManifesty Export-CliXmltambién crea archivos UTF-16LE.

Set-Content(y Add-Contentsi el archivo aún no existe / está vacío) usa codificación ANSI (la codificación especificada por la página de códigos heredados ANSI de la configuración regional activa, a la que PowerShell llama Default).

Export-Csvde hecho crea archivos ASCII, como se documenta, pero vea las notas a -Appendcontinuación.

Export-PSSession crea archivos UTF-8 con BOM por defecto.

New-Item -Type File -Value actualmente crea UTF-8 sin BOM (!).

El Send-MailMessagetema de ayuda también afirma que la codificación ASCII es la predeterminada; no he verificado personalmente esa afirmación.

Start-Transcript invariablemente crea archivos UTF-8 con BOM, pero consulte las notas a -Appendcontinuación.

Re comandos que se anexan a un archivo existente:

>>/ Out-File -AppendHacer ningún intento para que coincida con la codificación de de un archivo de contenido existente . Es decir, aplican ciegamente su codificación predeterminada, a menos que se indique lo contrario con -Encoding, que no es una opción con >>(excepto indirectamente en PSv5.1 +, via $PSDefaultParameterValues, como se muestra arriba). En resumen: debe conocer la codificación del contenido de un archivo existente y agregar usando esa misma codificación.

Add-Contentes la loable excepción: en ausencia de un -Encodingargumento explícito , detecta la codificación existente y la aplica automáticamente al nuevo contenido. Gracias, js2010 . Tenga en cuenta que en Windows PowerShell esto significa que la codificación ANSI se aplica si el contenido existente no tiene BOM, mientras que en PowerShell Core es UTF-8.

Esta incoherencia entre Out-File -Append/ >>y Add-Content, que también afecta a PowerShell Core , se analiza en este problema de GitHub .

Export-Csv -Append coincide parcialmente con la codificación existente: agrega ciegamente UTF-8 si la codificación del archivo existente es ASCII / UTF-8 / ANSI, pero coincide correctamente con UTF-16LE y UTF-16BE.
Para decirlo de otra manera: en ausencia de una lista de materiales, se Export-Csv -Appendasume que UTF-8 lo es, mientras que se Add-Contentasume que es ANSI.

Start-Transcript -Append Coincide parcialmente con la codificación existente: Coincide correctamente con las codificaciones con la lista de materiales , pero por defecto la codificación ASCII potencialmente con pérdida en ausencia de una.


Cmdlets que leen (es decir, la codificación utilizada en ausencia de una lista de materiales ):

Get-Contenty por Import-PowerShellDataFiledefecto ANSI ( Default), que es consistente con Set-Content.
ANSI es también lo que el motor de PowerShell tiene por defecto cuando lee el código fuente de los archivos.

Por el contrario, Import-Csv, Import-CliXmly Select-Stringasumir UTF-8 en ausencia de una lista de materiales.

3
pbies 2020-05-25 05:17.

Para ser breve, use:

write-output "your text" | out-file -append -encoding utf8 "filename"

Related questions

MORE COOL STUFF

La estrella de HGTV, Christina Hall, revela que tiene 'envenenamiento por mercurio y plomo' probablemente por voltear 'casas asquerosas'

La estrella de HGTV, Christina Hall, revela que tiene 'envenenamiento por mercurio y plomo' probablemente por voltear 'casas asquerosas'

La estrella de HGTV, Christina Hall, revela que le diagnosticaron envenenamiento por mercurio y plomo, probablemente debido a su trabajo como manipuladora de casas.

La estrella de 'Love Is Blind' Brennon Lemieux responde a los cargos de violencia doméstica

La estrella de 'Love Is Blind' Brennon Lemieux responde a los cargos de violencia doméstica

Recientemente salió a la luz un informe policial que acusa a la estrella de 'Love Is Blind', Brennon, de violencia doméstica. Ahora, Brennon ha respondido a los reclamos.

Wynonna Judd se dio cuenta de que ahora es la matriarca de la familia Judd en un momento festivo de pánico

Wynonna Judd se dio cuenta de que ahora es la matriarca de la familia Judd en un momento festivo de pánico

Conozca cómo Wynonna Judd se dio cuenta de que ahora es la matriarca de la familia mientras organizaba la primera celebración de Acción de Gracias desde que murió su madre, Naomi Judd.

Experto en lenguaje corporal explica los 'paralelos' entre Kate Middleton y la princesa Diana

Experto en lenguaje corporal explica los 'paralelos' entre Kate Middleton y la princesa Diana

Descubra por qué un destacado experto en lenguaje corporal cree que es fácil trazar "tales paralelismos" entre la princesa Kate Middleton y la princesa Diana.

Los láseres arrojan luz sobre por qué necesita cerrar la tapa antes de descargar

Los láseres arrojan luz sobre por qué necesita cerrar la tapa antes de descargar

Los inodoros arrojan columnas de aerosol invisibles con cada descarga. ¿Como sabemos? La prueba fue capturada por láseres de alta potencia.

The Secrets of Airline Travel Quiz

The Secrets of Airline Travel Quiz

Air travel is far more than getting from point A to point B safely. How much do you know about the million little details that go into flying on airplanes?

Where in the World Are You? Take our GeoGuesser Quiz

Where in the World Are You? Take our GeoGuesser Quiz

The world is a huge place, yet some GeoGuessr players know locations in mere seconds. Are you one of GeoGuessr's gifted elite? Take our quiz to find out!

¿Caduca el repelente de insectos?

¿Caduca el repelente de insectos?

¿Sigue siendo efectivo ese lote de repelente de insectos que te quedó del verano pasado? Si es así, ¿por cuánto tiempo?

Se revela la estatua de Godzilla más nueva de Tokio

Se revela la estatua de Godzilla más nueva de Tokio

Anteriormente, Kotaku informó que un hotel Godzilla se estaba abriendo en Tokio este abril. Junto al hotel, estaba programada la aparición de una enorme cabeza de 'Zilla, pero todo lo que hemos visto fueron imágenes conceptuales computarizadas.

El alcalde de Chicago realmente quiere que Elon Musk perfore un túnel debajo de la ciudad

El alcalde de Chicago realmente quiere que Elon Musk perfore un túnel debajo de la ciudad

Foto: Getty Desde que lanzó The Boring Company hace un año, Elon Musk ha mencionado varios sitios de construcción posibles para el negocio de perforación de túneles y ha descartado una vaga referencia a una aprobación gubernamental "verbal" para un túnel Hyperloop que conecta la ciudad de Nueva York y Washington. , CC. Pero ahora sabemos que al menos un alcalde quiere que Musk perfore un agujero debajo de su ciudad.

Ponle una tapa. En realidad, ponle una tapa a todo. Consigue 12 tapas de cocina elásticas de silicona por $14. [Exclusivo]

Ponle una tapa. En realidad, ponle una tapa a todo. Consigue 12 tapas de cocina elásticas de silicona por $14. [Exclusivo]

Tapas elásticas de silicona de Tomorrow's Kitchen, paquete de 12 | $14 | Amazonas | Código promocional 20OFFKINJALids son básicamente los calcetines de la cocina; siempre perdiéndose, dejando contenedores huérfanos que nunca podrán volver a cerrarse. Pero, ¿y si sus tapas pudieran estirarse y adaptarse a todos los recipientes, ollas, sartenes e incluso frutas en rodajas grandes que sobran? Nunca más tendrás que preocuparte por perder esa tapa tan específica.

Cuéntanos tus mejores trucos de Washington, DC

Cuéntanos tus mejores trucos de Washington, DC

Hemos pirateado algunas ciudades industriales en esta columna, como Los Ángeles y Las Vegas. Ahora es el momento de una ciudad militar-industrial-compleja.

Patinaje artístico de EE. UU. 'frustrado' por falta de decisión final en evento por equipos, pide una decisión justa

Patinaje artístico de EE. UU. 'frustrado' por falta de decisión final en evento por equipos, pide una decisión justa

El equipo está a la espera de las medallas que ganó en los Juegos Olímpicos de Invierno de 2022 en Beijing, ya que se está resolviendo un caso de dopaje que involucra a la patinadora artística rusa Kamila Valieva.

Los compradores de Amazon dicen que duermen 'como un bebé mimado' gracias a estas fundas de almohada de seda que cuestan tan solo $ 10

Los compradores de Amazon dicen que duermen 'como un bebé mimado' gracias a estas fundas de almohada de seda que cuestan tan solo $ 10

Miles de compradores de Amazon recomiendan la funda de almohada de seda Mulberry, y está a la venta en este momento. La funda de almohada de seda viene en varios colores y ayuda a mantener el cabello suave y la piel clara. Compre las fundas de almohada de seda mientras tienen hasta un 46 por ciento de descuento en Amazon

Se busca al corredor de los Bengals Joe Mixon por orden de arresto emitida por presuntamente apuntar con un arma de fuego a una mujer

Se busca al corredor de los Bengals Joe Mixon por orden de arresto emitida por presuntamente apuntar con un arma de fuego a una mujer

El jueves se presentó una denuncia de delito menor amenazante agravado contra Joe Mixon.

Profesor de la Universidad de Purdue arrestado por presuntamente traficar metanfetamina y proponer favores sexuales a mujeres

Profesor de la Universidad de Purdue arrestado por presuntamente traficar metanfetamina y proponer favores sexuales a mujeres

El Departamento de Policía de Lafayette comenzó a investigar a un profesor de la Universidad de Purdue en diciembre después de recibir varias denuncias de un "hombre sospechoso que se acercaba a una mujer".

Concept Drift: el mundo está cambiando demasiado rápido para la IA

Concept Drift: el mundo está cambiando demasiado rápido para la IA

Al igual que el mundo que nos rodea, el lenguaje siempre está cambiando. Mientras que en eras anteriores los cambios en el idioma ocurrían durante años o incluso décadas, ahora pueden ocurrir en cuestión de días o incluso horas.

India me está pateando el culo

India me está pateando el culo

Estoy de vuelta por primera vez en seis años. No puedo decirte cuánto tiempo he estado esperando esto.

ℝ

“And a river went out of Eden to water the garden, and from thence it was parted and became into four heads” Genesis 2:10. ? The heart is located in the middle of the thoracic cavity, pointing eastward.

¿Merrick Garland le ha fallado a Estados Unidos?

Es más de la mitad de la presidencia de Biden. ¿Qué está esperando Merrick Garland?

¿Merrick Garland le ha fallado a Estados Unidos?

Creo, un poco tarde en la vida, en dar oportunidades a la gente. Generosamente.

Language