Я использую селен для вставки ввода текста с немецкими умлаутами в веб-формуле. Заявленная кодировка для скрипта python — utf-8. На странице используется кодировка utf-8. Когда я определяю такую строку, все работает нормально:
q = u"Hällö" #type(q) returns unicode
...
textbox.send_keys(q)
Но когда я пытаюсь прочитать файл конфигурации с помощью ConfigParser (или другого типа файла), я получаю искаженный вывод в веб-формуляре (Hällö
). Это код, который я использую для этого:
the_encoding = chardet.detect(q)['encoding'] #prints utf-8
q = parser.get('info', 'query') # type(q) returns str
q = q.decode('unicode-escape') # type(q) returns unicode
textbox.send_keys(q)
В чем разница между обоими q, данными функции send_keys?