Хобрук: Ваш путь к мастерству в программировании

Публикации по теме 'unicode'


ASCII и Юникод (UTF)
ASCII (Американский стандартный код обмена информацией). Представление текста с помощью чисел. Первоначально он был разработан для телетайпов, по сути, для обычного текста без форматирования. ASCII - это 7-битный набор символов, содержащий 128 символов. Он включает заглавные и строчные буквы A – Z, числа и специальные символы (разрыв строки, возврат каретки, escape и т. Д.). N.B. Разрывы строк CR и LF - управляющие символы ASCII. CR - это байт-код для возврата каретки (со времен..

Атаки НЛП, часть 1  — «Почему не стоит доверять своим моделям классификации текста»
Эта серия сообщений в блоге посвящена обширной и важной области, объединяющей искусственный интеллект и лингвистику: Атаки НЛП . NLP расшифровывается как Обработка естественного языка , подобласть науки о данных, целью которой является изучение и анализ механизмов, лежащих в основе представления и использования человеческого языка с помощью компьютеров и встроенных системы. Тематическое исследование Представьте, что вы специалист по данным, работающий в команде модерации..

Используйте normalize() для дуэли с неанглоязычной строкой в ​​javascript
Для международного веб-сайта нам может потребоваться обработка разных языков, в некоторых случаях пользователю может потребоваться вводить данные на своем языке, мы не можем контролировать то, что они печатают, они могут злонамеренно или случайно ввести что-то, чего мы не ожидаем. Один известный пример: const name1 = '\u0041\u006d\u00e9\u006c\u0069\u0065'; const name2 = '\u0041\u006d\u0065\u0301\u006c\u0069\u0065'; console.log(`${name1}, ${name2}`); // expected output: "Amélie,..

Вопросы по теме 'unicode'

Регулярное выражение и юникод
У меня есть скрипт, который анализирует имена файлов телевизионных эпизодов (например, show.name.s01e02.avi), берет название эпизода (из API www.thetvdb.com) и автоматически переименовывает его во что-то более приятное (Show Name - [01x02 ].avi)...

Загружать карту символов Юникода, когда пользователь выбирает язык
Я знаю, что этот вопрос немного расплывчатый и не уверен, что это вообще возможно. На моем веб-сайте я хочу отобразить поле со списком с максимально возможными языками (доступными в Unicode), и когда пользователь выбирает язык, должна быть загружена...

Вызов синтаксического анализа канала из веб-автоматического декодирования Punycode для IDN в .NET
У меня есть RSS-канал http://xn--d1abbgf6aiiy.xn--p1ai/feeds Когда я добавляю этот канал через приложение Web ASP.Net MVC и вызываю метод для анализа канала, свойства канала автоматически преобразуются из представления ASCII в Unicode в свойствах....
20.04.2024

Python UnicodeDecodeError: ascii против utf-8
Почему следующий код по-прежнему использует «ascii» для декодирования строки. Разве я не сказал python использовать «utf-8» для декодирования строки? Кроме того, почему ignore не сработало? print data.encode('utf-8', 'ignore')...

Как поддерживать расширенные символы curses с помощью PuTTY
Я создаю программу curses, которая должна использовать специальные символы прямоугольника ( │ , ─ , ┌ и т. д.), которые можно найти здесь . Я подключаюсь к серверу Linux, где я программирую с помощью PuTTY. Когда я просто устанавливаю границу...

Python кодирует юникод utf-8
Я использую селен для вставки ввода текста с немецкими умлаутами в веб-формуле. Заявленная кодировка для скрипта python — utf-8. На странице используется кодировка utf-8. Когда я определяю такую ​​строку, все работает нормально: q = u"Hällö"...

Поиск символов с наложением длинного штриха Unicode, примененным в excel
Я импортировал файл из текста в Excel, в котором есть несколько значений, вычеркнутых с использованием наложения юникода с длинным штрихом. Мне нужно найти и заменить их все на ноль. Какую функцию я могу использовать, чтобы найти эти символы?
08.05.2024

Как изменить Sys.setlocale, когда вы получаете запрос об ошибке для установки локали … не может быть выполнено
Это относится к проблеме, которую я пытаюсь решить здесь: Печать символов UTF-8 (русский) в R, Rmd, Knitr . Мне сказали, что этой проблемы не существует, если родная локаль en_US.UTF-8 . (Мой текущий родной язык — English_Canada.1252 .) Но я...

Почему переменная счетчика неожиданно увеличивается при каждом вызове подпрограммы?
[ОТ РЕДАКЦИИ: я прочитал этот вопрос , но ( в то время как в ретроспективе это в конечном счете связано таким же образом, как и каждый вопрос здесь, например, «Почему компьютеры работают со сбоями?»), этот ответ не является ответом на мой вопрос....

Какие веб-безопасные арабские шрифты будут работать во всех старых и новых браузерах?
Я ищу список веб-безопасных шрифтов для арабского языка, но они должны работать во всех браузерах, включая старые браузеры и IE. Я знаю, что со мной справится Arial, но есть ли другие шрифты? Спасибо

Проверьте, содержит ли строка Java символ Юникода
Я пытаюсь проверить, содержит ли строка определенную точку юникода из шрифта Segoe MDL2 Assets. Пример значения Unicode, которое я хочу проверить, это \uF14B Вот откуда я беру свои значения...
21.04.2024

Стандартная библиотека C++ и строки Unicode
Почему стандарт C++ предписывает поддержку wstring в библиотеке ввода-вывода и библиотеке регулярных выражений, но не требует поддержки u8string , u16string и u32string в этих библиотеках? Я задал аналогичный вопрос восемь лет назад (...

Новые материалы

Аргументы прогрессивного улучшения почти всегда упускают суть
В наши дни в кругах веб-разработчиков много болтают о Progressive Enhancement — PE, но на самом деле почти все аргументы с обеих сторон упускают самую фундаментальную причину, по которой PE..

Введение в Джанго Фреймворк
Схема «работать умно, а не усердно» В этой и последующих статьях я познакомлю вас с тем, что такое фреймворк Django и как создать свое первое приложение с помощью простых и понятных шагов, а..

Настольный ПК как «одно кольцо, чтобы править всеми» домашних компьютеров
Вид после 9 месяцев использования С настольных компьютеров все началось, но в какой-то момент они стали «серверами», и мы все перешли на ноутбуки. В прошлом году я столкнулся с идеей настольных..

Расширенные методы безопасности для VueJS: реализация аутентификации без пароля
Руководство, которое поможет вам создавать безопасные приложения в долгосрочной перспективе Безопасность приложений часто упускается из виду в процессе разработки, потому что основная..

стройный-i18следующий
Представляем стройную оболочку для i18next. Эта библиотека, основанная на i18next, заключает экземпляр i18next в хранилище svelte и отслеживает события i18next, такие как languageChanged,..

Обзор 20 основных и современных методов работы с массивами в JavaScript
Вы знаете их всех? В этом коротком посте я покажу сводку методов, доступных в JavaScript для работы с массивами. Я надеюсь, что вы найдете это полезным! В конце поста вы найдете ссылку на..

Да, но я чувствую необходимость указать, что это или не единственные два.
Да, но я чувствую необходимость указать, что это или не единственные два. Обучение с подкреплением (в качестве примера) также является важным.