Хобрук: Ваш путь к мастерству в программировании

Странное поведение при записи файла RTF

У меня странное поведение в Matlab при работе с файлами RTF.

Файл rtf читается с помощью этой инструкции:

cin = textread(filename, '%s', 'delimiter', '\n');

(cin) — это ячейка Nx1, где N — количество строк в файле, поэтому я могу редактировать какую-то конкретную строку.

Я пишу файл RTF с функцией ниже:

function dum=   cell2rtf(cin, filename)
    
    [row, col]=     size(cin);                  
    fout=           fopen(filename, 'w');       
    for ii=1:row
        if(ii<row)
            fprintf(fout, '%s\r\n', cin{ii});
        else
            fprintf(fout, '%s',     cin{ii});
        end
    end
    fclose(fout); 

Странное поведение заключается в следующем: если строка cin{x} представляет собой строку с содержимым

'19°\cell 19°\cell \cell \cell \cell 70°'

та же строка появляется, как показано ниже, когда файл записывается функцией

'19°\cell 19°\cell \cell \cell \cell 70°'

Я не могу понять, почему char '°' становится '°' в каждом случае, и я хотел бы знать, как это можно исправить.

14.10.2020

Ответы:


1

Проблема в том, что textread() работает с обычными текстовыми файлами, а файлы RTF не являются обычными текстовыми файлами: это двоичные файлы, содержащие коды разметки и форматирования, вроде как файлы Word .doc. textread(), вероятно, сталкивается с этими кодами форматирования/структуры и неверно интерпретирует их как обычные текстовые символы, и именно отсюда берутся ваши ненужные символы, такие как Â.

Не могли бы вы просто сохранить свой RTF-файл как обычный текстовый файл и прочитать его?

В противном случае вам нужно будет написать синтаксический анализатор RTF или найти библиотеку синтаксического анализа RTF и использовать ее. Matlab (отчасти) легко работает с библиотеками Java, поэтому вы можете использовать библиотеку Apache Tika RTFParser или RTFParserKit.

15.10.2020
Новые материалы

ВЫ РЕГРЕСС ЭТО?
Чтобы понять, когда использовать регрессионный анализ, мы должны сначала понять, что именно он делает. Вот простой ответ, который появляется, когда вы используете Google: Регрессионный..

Не зря же это называют интеллектом
Стек — C#, Oracle Опыт — 4 года Работа — Разведывательный корпус Мне пора служить Может быть, я немного приукрашиваю себя, но там, где я живу, есть обязательная военная служба на 3..

LeetCode Проблема 41. Первый пропущенный положительный результат
LeetCode Проблема 41. Первый пропущенный положительный результат Учитывая несортированный массив целых чисел, найдите наименьшее пропущенное положительное целое число. Пример 1: Input:..

Расистский и сексистский робот, обученный в Интернете
Его ИИ основан на предвзятых данных, которые создают предрассудки. Он словно переходит из одного эпизода в другой из серии Черное зеркало , а вместо этого представляет собой хронику..

Управление состоянием в микрофронтендах
Стратегии бесперебойного сотрудничества Микро-фронтенды — это быстро растущая тенденция в сфере фронтенда, гарантирующая, что удовольствие не ограничивается исключительно бэкэнд-системами..

Декларативное и функциональное программирование в стиле LINQ с использованием JavaScript с использованием каррирования и генератора ...
LINQ - одна из лучших функций C #, которая обеспечивает элегантный способ написания кода декларативного и функционального стиля, который легко читать и понимать. Благодаря таким функциям ES6,..

Структуры данных в C ++ - Часть 1
Реализация общих структур данных в C ++ C ++ - это расширение языка программирования C, которое поддерживает создание классов, поэтому оно известно как C с классами . Он используется для..