Я захватил стандартный вывод внешней программы в объект bytes и хочу преобразовать его в обычную строку Python, чтобы вывести ее. Как преобразовать объект bytes в str с помощью Python 3?

Самый простой способ преобразования байтов в строку в Python 3 - использовать метод .decode() для вашего объекта bytes. Для вывода subprocess конкретно вы можете либо декодировать байты вручную, либо использовать параметр text=True (доступен в Python 3.7+), чтобы получать строки сразу с самого начала.

Другое

Как преобразовать байты в строку в Python 3

Узнайте несколько способов преобразования байтов в строки в Python 3, включая вывод из subprocess. Изучите методы .decode(), параметр text=True и техники обработки кодировок с практическими примерами.

Авторы: НейроАгент

20.11.2025, 09:51

Как преобразовать байты в строку в Python 3

Я захватил стандартный вывод внешней программы в объект bytes:

python

>>> from subprocess import *
>>> stdout = Popen(['ls', '-l'], stdout=PIPE).communicate()[0]
>>> stdout
b'total 0\n-rw-rw-r-- 1 thomas thomas 0 Mar  3 07:03 file1\n-rw-rw-r-- 1 thomas thomas 0 Mar  3 07:03 file2\n'

Я хочу преобразовать это в обычную строку Python, чтобы можно было вывести её так:

python

>>> print(stdout)
-rw-rw-r-- 1 thomas thomas 0 Mar  3 07:03 file1
-rw-rw-r-- 1 thomas thomas 0 Mar  3 07:03 file2

Как преобразовать объект bytes в str в Python 3?

Самый простой способ преобразования байтов в строку в Python 3 - использовать метод .decode() для объекта байтов. Для вывода из subprocess вы можете либо декодировать байты вручную, либо использовать параметр text=True (доступен в Python 3.7+), чтобы получать строки сразу с самого начала.

Базовое преобразование байтов в строку

В Python 3 основной метод преобразования байтов в строку - использование метода .decode(). Когда у вас есть объект байтов, как в выводе subprocess, вы можете преобразовать его в обычную строку, указав кодировку:

python

>>> stdout = b'total 0\n-rw-rw-r-- 1 thomas thomas 0 Mar  3 07:03 file1\n'
>>> string_output = stdout.decode('utf-8')
>>> print(string_output)
total 0
-rw-rw-r-- 1 thomas thomas 0 Mar  3 07:03 file1

Метод decode() принимает параметр кодировки, где utf-8 является наиболее распространенным по умолчанию. Согласно документации Python 3.14.0, функции subprocess возвращают данные в виде закодированных байтов по умолчанию, и приложению необходимо обрабатывать декодирование.

Для вашего конкретного случая:

python

>>> from subprocess import *
>>> stdout = Popen(['ls', '-l'], stdout=PIPE).communicate()[0]
>>> string_output = stdout.decode('utf-8')
>>> print(string_output)
total 0
-rw-rw-r-- 1 thomas thomas 0 Mar  3 07:03 file1
-rw-rw-r-- 1 thomas thomas 0 Mar  3 07:03 file2

Преобразование вывода subprocess

При работе с выводом subprocess существует несколько подходов для получения строк вместо байтов:

Метод 1: Использование `text=True` (Рекомендуется для Python 3.7+)

Современный подход - использовать параметр text=True (или universal_newlines=True в более старых версиях), который автоматически обрабатывает преобразование:

python

>>> from subprocess import Popen, PIPE
>>> process = Popen(['ls', '-l'], stdout=PIPE, text=True)
>>> stdout = process.communicate()[0]
>>> print(stdout)  # stdout уже является строкой
total 0
-rw-rw-r-- 1 thomas thomas 0 Mar  3 07:03 file1
-rw-rw-r-- 1 thomas thomas 0 Mar  3 07:03 file2

Как объясняется на Stack Overflow, этот подход более чистый и позволяет избежать ручного декодирования.

Метод 2: Использование параметра `encoding`

Вы также можете указать кодировку напрямую:

python

>>> process = Popen(['ls', '-l'], stdout=PIPE, encoding='utf-8')
>>> stdout = process.communicate()[0]

Метод 3: Использование `subprocess.run()` (Современный API)

Для более новых версий Python предпочтительным методом является subprocess.run():

python

>>> import subprocess
>>> result = subprocess.run(['ls', '-l'], capture_output=True, text=True)
>>> print(result.stdout)
total 0
-rw-rw-r-- 1 thomas thomas 0 Mar  3 07:03 file1
-rw-rw-r-- 1 thomas thomas 0 Mar  3 07:03 file2

Продвинутые методы декодирования

Обработка разных кодировок

Иногда вывод subprocess может быть не в UTF-8. Вы можете указать разные кодировки:

python

# Для вывода команд Windows (часто cp437 или cp1252)
output = subprocess.check_output('dir', shell=True, encoding='cp437')

Как отмечено в обсуждении на Stack Overflow, для определенных системных команд может потребоваться использовать платформо-зависимые кодировки.

Прямое разделение строк

Вы можете декодировать и разделить строки за одну операцию:

python

>>> lines = stdout.decode('utf-8').splitlines()
>>> for line in lines:
...     print(line)
total 0
-rw-rw-r-- 1 thomas thomas 0 Mar  3 07:03 file1
-rw-rw-r-- 1 thomas thomas 0 Mar  3 07:03 file2

Использование менеджеров контекста

Для более надежной обработки используйте менеджеры контекста:

python

import subprocess

with subprocess.Popen(['ls', '-l'], stdout=subprocess.PIPE, text=True) as p:
    stdout, stderr = p.communicate()
    print(stdout)

Обработка проблем с кодировкой

Обработка ошибок при декодировании

При декодировании байтов вы можете столкнуться с ошибками кодировки. Вы можете обработать их с помощью параметра errors:

python

# Игнорировать ошибки
clean_string = corrupted_bytes.decode('utf-8', errors='ignore')

# Заменять ошибки на-placeholder
clean_string = corrupted_bytes.decode('utf-8', errors='replace')

# Строгий режим (по умолчанию) - вызывает UnicodeDecodeError при ошибках
clean_string = corrupted_bytes.decode('utf-8', errors='strict')

Как указано на sqlpey, аргумент errors особенно полезен при работе с поврежденными или смешанными данными по кодировке.

Определение кодировки

В случаях, когда вы не уверены в кодировке, может потребоваться сначала определить ее:

python

import locale

# Использовать предпочитаемую системой кодировку
encoding = locale.getpreferredencoding(False)
output = stdout.decode(encoding, errors='replace')

Обсуждение на Stack Overflow объясняет, как определение кодировки может помочь с выводом subprocess.

Лучшие практики

Предпочитайте text=True для Python 3.7+ - это более чистый и менее подверженный ошибкам подход, чем ручное декодирование.
Явно указывайте кодировку - не полагайтесь на системные значения по умолчанию при работе с выводом внешних команд.
Используйте обработку ошибок - всегда учитывайте, что произойдет при сбое декодирования.
Выбирайте подходящую функцию subprocess - subprocess.run() предпочтительна для современного Python.
Рассмотрите использование менеджеров контекста - они обеспечивают правильную очистку ресурсов.

Как указано в документации Python, “фактическая кодировка выходных данных может зависеть от вызываемой команды, поэтому декодирование в текст часто необходимо обрабатывать на уровне приложения.”

Полные примеры

Пример 1: Базовое преобразование

python

from subprocess import Popen, PIPE

# Получаем вывод в байтах
process = Popen(['ls', '-l'], stdout=PIPE)
stdout_bytes, stderr_bytes = process.communicate()

# Преобразуем в строку
stdout_str = stdout_bytes.decode('utf-8')

print(stdout_str)

Пример 2: Современный подход (Рекомендуется)

python

import subprocess

# Получаем вывод в виде строк напрямую
result = subprocess.run(['ls', '-l'], capture_output=True, text=True)

print(result.stdout)

Пример 3: Надежная обработка ошибок

python

import subprocess
import locale

try:
    # Сначала пробуем с UTF-8
    result = subprocess.run(['ls', '-l'], capture_output=True, text=True, encoding='utf-8')
    print(result.stdout)
except UnicodeDecodeError:
    # Откат к системной кодировке
    result = subprocess.run(['ls', '-l'], capture_output=True, text=True, encoding=locale.getpreferredencoding())
    print(result.stdout)

Пример 4: Работа с несколькими командами

python

import subprocess

commands = [
    ['ls', '-l'],
    ['date'],
    ['whoami']
]

for cmd in commands:
    result = subprocess.run(cmd, capture_output=True, text=True, encoding='utf-8')
    print(f"Команда: {' '.join(cmd)}")
    print("Вывод:")
    print(result.stdout)
    print("-" * 40)

Источники

Заключение

Преобразование байтов в строку в Python 3 становится простым, как только вы понимаете доступные методы. Для вывода subprocess наиболее простым решением является либо использование .decode('utf-8') для объекта байтов, либо использование параметра text=True для получения строк напрямую.

Ключевые выводы:

Используйте .decode('utf-8') для ручного преобразования
Предпочитайте параметр text=True (Python 3.7+) для более чистого кода
Обрабатывайте ошибки кодирования с помощью параметра errors при необходимости
Рассмотрите использование subprocess.run() вместо Popen для современного Python кода
Помните, что кодировка вывода subprocess может различаться между системами

Выберите метод, который лучше всего подходит для вашей версии Python и конкретного случая использования, и всегда учитывайте потенциальные проблемы с кодировкой при работе с выводом внешних команд.

Авторы

НейроАгент

Автор

Проверено модерацией

НейроОтветы

Модерация

Как преобразовать байты в строку в Python 3

Содержание

Базовое преобразование байтов в строку

Преобразование вывода subprocess

Метод 1: Использование text=True (Рекомендуется для Python 3.7+)

Метод 2: Использование параметра encoding

Метод 3: Использование subprocess.run() (Современный API)

Продвинутые методы декодирования

Обработка разных кодировок

Прямое разделение строк

Использование менеджеров контекста

Обработка проблем с кодировкой

Обработка ошибок при декодировании

Определение кодировки

Лучшие практики

Полные примеры

Пример 1: Базовое преобразование

Пример 2: Современный подход (Рекомендуется)

Пример 3: Надежная обработка ошибок

Пример 4: Работа с несколькими командами

Источники

Заключение

Метод 1: Использование `text=True` (Рекомендуется для Python 3.7+)

Метод 2: Использование параметра `encoding`

Метод 3: Использование `subprocess.run()` (Современный API)