Бинарные файлы и данные в PHP
Бинарный файл или как их еще называю двоичные — это формат представления данных с использованием двоичной системы счисления. В отличие от текстовых файлов, которые содержат информацию в виде символов, букв, цифр и т.д., такие форматы хранят информацию как последовательность битов. Двоичные файлы могут содержать данные разных типов, такие как числа, символы, звуковые или видеофайлы, изображения и многое другое.
Любой кусочек информации в компьютере записан в двоичном формате, поэтому для того чтобы сохранить что-то полезное, нужно информацию преобразовать в этот самый вид. Основной единицей представления данных, которые обычно используют для того чтобы хотя бы приблизительно продемонстрировать информацию в "сыром" виде, являются байты. Выглядеть это может вот так:
Просто так прочитать такую информацию практически невозможно, однако, были придуманы специальные правила, какие именно данные должны находиться на какой позиции в файле. То есть это все еще просто нули и единицы, просто их скомпоновали так, чтобы было проще читать.
Что за правила используют для описания файла? Это спецификации форматов файлов, их можно найти в сети, обычно формат файла разрабатывается для ОС, либо для конкретного программного обеспечения.
Инструменты для просмотра структуры и данных
Универсальным способом просмотра бинарных файлов является открытие файлов с помощью шестнадцатеричного рекдатора. Одними из наиболее популярных в этой области являются:
- Hex Editor
- Hiew
- WinHex Editor
Этими инструментами можно пользоваться в двух случаях:
- Если для написания своего разборщика нужно понять что именно записано в файле
- У некоторых приложений есть функции разметки файла, просмотр функций