[info]ru_java


ru.java

все о языке программирования java


Previous Entry Add to Memories Share Next Entry
Unicode
delta
[info]deltoideus wrote in [info]ru_java
Во время анализа HTML кода натыкаюсь на HTML unicode (γ β δ ... и т.д). Возможо ли перевести их в Java unicode ("\u03B3", "\u03B2", "\u03B4", ... и т.д) для вывода этих знаков в JTextField как γ β δ ... и т.д?
_____________________________
Update: Проблема решена

Если интересно, решение тут

А просто заменить регулярными выражениями, типа:

прочитаная_строка.replaceAll("&#x(?=\d{4};)","\\u");
прочитаная_строка.replaceAll("&#x(?=\d{3};)","\\u0");
прочитаная_строка.replaceAll("&#x(?=\d{2};)","\\u00");
прочитаная_строка.replaceAll("&#x(?=\d{1};)","\\u000");

работать, правда меееееедленно будет.....

Да, но тогда получится string вида "\\u03B2", а в JTextField он отображается как "\u03B2", а не "β".
Т.е. вопрос скорее в том, как из "\\u03B2" получит уникодный знак "β"

Вопрос в возможности не стоит. Если нужно - значит нужно сделать. Можно фимльтр написать, который сделает это быстро. Можно кое-как регэкспами, например...

Эх вот вечно кто то наступает именно на эти грабли. А стандартного решения до сих пор нет ...