Brak polskich znaków w eksporcie do Worda z DejaVu Autor vlákna: Oryctes
| Oryctes Local time: 11:06 angličtina -> polština + ...
Właśnie wykonałem swoje pierwsze tłumaczenie z użyciem DejaVu i mam problem: po wyeksportowaniu tłumaczenia do Worda okazuje się, że w przypisach polskie litery zostały zastąpione rozmaitymi egzotycznymi znaczkami. Efekt ten nie występuje w tekście głównym, gdzie również występują polskie słowa. Byłbym zobowiązany za podpowiedź, jak uporać się z tym problemem. | | | Trochę wiecej informacji poprosimy | Aug 31, 2009 |
Normalne to nie jest, powinno to działac. Ale zanim ktokolwiek może Ci pomoc, proszę podac, z jaka wersja Word-a pracujesz, jaki filter używałeś do importowania i jaki build Deja Vu używaz. I - właśnie padnie mi do głowy: w jakiej czcionce oryginalny tekst był napisany w Wordzie? Może spróbuj zmienic czcionkę. A jeśli nic nie pomozy, to mogę na razie tylko sugerowac zastapic wszystkie błędne znaki (mówisz, że są one rozmaite, więc z paroma akcjami zastąpienia powinno się ... See more Normalne to nie jest, powinno to działac. Ale zanim ktokolwiek może Ci pomoc, proszę podac, z jaka wersja Word-a pracujesz, jaki filter używałeś do importowania i jaki build Deja Vu używaz. I - właśnie padnie mi do głowy: w jakiej czcionce oryginalny tekst był napisany w Wordzie? Może spróbuj zmienic czcionkę. A jeśli nic nie pomozy, to mogę na razie tylko sugerowac zastapic wszystkie błędne znaki (mówisz, że są one rozmaite, więc z paroma akcjami zastąpienia powinno się zrobic) przez odpowiednie polskie. ▲ Collapse | | | Parę słów więcej... | Aug 31, 2009 |
Wolfgang Jörissen wrote:
Normalne to nie jest, powinno to działac. Ale zanim ktokolwiek może Ci pomoc, proszę podac, z jaka wersja Word-a pracujesz, jaki filter używałeś do importowania
Normalnie importuję do DVX po przepuszczeniu przez Tradosa (bilingual RTF/DOC//TTX).
W zasadzie nigdy nie mam problemów, a RTF/DOC są zwykle lepsze niż obrabiane bezpośrednio w Tradosie.
i jaki build Deja Vu używaz.
Oczywiście ostatni jest najlepszy![](https://cfcdn.proz.com/images/bb/smiles/icon_smile.gif)
I - właśnie padnie mi do głowy: w jakiej czcionce oryginalny tekst był napisany w Wordzie? Może spróbuj zmienic czcionkę.
Mhm.
To może być powód.
Jeżeli czcionka nie jest czcionką Unicode, nie ma siły, żeby polskie literki były wyświetlane poprawnie, to problem niezależny od narzędzia CAT.
A jeśli nic nie pomozy, to mogę na razie tylko sugerowac zastapic wszystkie błędne znaki (mówisz, że są one rozmaite, więc z paroma akcjami zastąpienia powinno się zrobic) przez odpowiednie polskie.
Mhm.
Albo, jeśli czcionka jest "dziwna" zamień ją globalnie na jakąś standardową wyglądającą podobnie, może wystarczy.
Zdrówkot
GG | | | Oryctes Local time: 11:06 angličtina -> polština + ... AUTOR TÉMATU więcej informacji | Aug 31, 2009 |
Używam DejaVu 7.0.284 oraz Worda 97. Nie dokonywałem żadnych zmian w filtrach, więc DejaVu wykorzystał zapewne filtr dla doc. bo taki format miał plik źródłowy. Stosowałem czcionkę New Times Roman. Co ciekawe, polskich liter (z wyjątkiem ó) brakuje tylko w przypisach.
Próbowałem zastąpić je w Wordzie przy sprawdzaniu pisowni, ale Word wcale nie uznaje wyrazów z tymi znakami za błędne, tak jakby widział je jako prawidłowe litery.
Nie da się również zas... See more Używam DejaVu 7.0.284 oraz Worda 97. Nie dokonywałem żadnych zmian w filtrach, więc DejaVu wykorzystał zapewne filtr dla doc. bo taki format miał plik źródłowy. Stosowałem czcionkę New Times Roman. Co ciekawe, polskich liter (z wyjątkiem ó) brakuje tylko w przypisach.
Próbowałem zastąpić je w Wordzie przy sprawdzaniu pisowni, ale Word wcale nie uznaje wyrazów z tymi znakami za błędne, tak jakby widział je jako prawidłowe litery.
Nie da się również zastąpić ich za pomocą funkcji "znajdź i zastąp", ponieważ przy wpisywaniu tych znaków do okienka "znajdź" uzyskuję normalną polską literę, której program nie znajduje w tekście: np. zamiast "Ż" mam taką górną kreskę, więc próbuję ją zastąpić wpisując w okno "znajdź" alt+cntrl+shift+z, bo taki jest skrót klawiaturowy dla tej kreski, ale zamiast kreski pojawia się właśnie "Ż". W przeciwieństwie do modułu sprawdzania pisowni, który traktuje górną kreskę jak "Ż", moduł wyszukiwania uznaje ją za inny znak, więc szukając "Ż" nie jestem w stanie wyszukać i zastąpić owych górnych kresek. Pozostaje mozolne wyszukiwanie i zastąpowanie wszystkich znaczków po jednym, co jest dość czasochłonne. ▲ Collapse | |
|
|
Piotr Bienkowski Polsko Local time: 11:06 Člen (2005) angličtina -> polština + ... Jakieś 10 lat temu miałem podobny problem :-) | Sep 1, 2009 |
Oryctes wrote:
Właśnie wykonałem swoje pierwsze tłumaczenie z użyciem DejaVu i mam problem: po wyeksportowaniu tłumaczenia do Worda okazuje się, że w przypisach polskie litery zostały zastąpione rozmaitymi egzotycznymi znaczkami. Efekt ten nie występuje w tekście głównym, gdzie również występują polskie słowa. Byłbym zobowiązany za podpowiedź, jak uporać się z tym problemem.
I po wypróbowaniu wszelkich możliwych konwersji wpadłem na pomysł hackerski. Zapisywałem plik jako RTF, otwierałem w edytorze tekstowym (wtedy był to NoteTab Pro) i zamieniałem coś w okolicach tekstu fcharset dla używanej w dokumencie czcionki. Tylko teraz już nie pamiętam, czy to była zamiana fcharset0 na fcharset250 czy fcharset252... Ale działało!
Oczywiście nikt nie powinien musieć wykonywać takich karkołomnych zabiegów, aby uzyskać dokument z poprawnie wyświetlanymi polskimi znakami. To była moja krótka przygoda z DejaVu, bo niedługo po "opatentowaniu" tego "wynalazku" pożegnałem się z tamtą firmą.
Pozdrawiam,
Piotr | | | Stare DV i RTF... | Sep 1, 2009 |
Piotr Bienkowski wrote:
I po wypróbowaniu wszelkich możliwych konwersji wpadłem na pomysł hackerski. Zapisywałem plik jako RTF, otwierałem w edytorze tekstowym (wtedy był to NoteTab Pro) i zamieniałem coś w okolicach tekstu fcharset dla używanej w dokumencie czcionki. Tylko teraz już nie pamiętam, czy to była zamiana fcharset0 na fcharset250 czy fcharset252... Ale działało![/quote]
fcharset238
Mnie się zwykle nie chciało dłubać i otwierałem to w Wordzie 95, gdzie to było czytelniejsze.
To ostatni Word, który kanonicznie obsługuje RTF, więc służy mi interwencyjnie do dzisiaj![](https://cfcdn.proz.com/images/bb/smiles/icon_smile.gif)
W dzisiejszym Wordzie można spróbować zaznaczyć wszystkie przypisy, znaleźć w menu lub na tych kretyńskich wstążkach opcję Popraw uszkodzony tekst, a jak Łotr już poprawi tekst, samemu ręcznie poprawić formatowanie, które Łotr przy okazji psuje.
Oczywiście nikt nie powinien musieć wykonywać takich karkołomnych zabiegów, aby uzyskać dokument z poprawnie wyświetlanymi polskimi znakami.
To akurat jest często sprawa nieprawidłowej struktury RTF, który np. pobiera domyślny charset z systemu i podobne.
To była moja krótka przygoda z DejaVu, bo niedługo po "opatentowaniu" tego "wynalazku" pożegnałem się z tamtą firmą.
DV3 i starsze pracowały na 256-znakowych stronach kodowych i to było rzeczywiście potwornie wkurzające, zwłaszcza w dokumentach wielojęzycznych, które na wyjściu nigdy nie były poprawne, jeśli w środku był zestaw Western, CE, greka itp.
Do tego stopnia, że w pewnym momencie w desperacji kupiłem SDLX, żeby tylko nie dotykać Tradosa, który w moich głównych parach językowych nie nadawał się wtedy domyślnie absolutnie do niczego.
Ale jak DVX się ustabilizował w końcu 2004, z przyjemnością SDLX wypieprzyłem, bo co to za CAT, który nie ma nawet fuzzy terminology recognition![](https://cfcdn.proz.com/images/bb/smiles/icon_smile.gif)
Ogólnie, obecnie DVX wypuszcza RTF o niebo lepsze niż Trados rozumiany jako klasyczna nakładka na Worda, ponieważ nie próbuje "poprawiać" struktury pliku i nie gra nieudolnie na stylach.
Ma to tę przykrą konsekwencję, że jak na wejściu jest śmieć, nawet niewidoczny, może się ujawnić i na wyjściu.
Ja teksty, które podejrzewam o śmieciowość (czyli OCR, gnioty fatalnie sformatowane na pierwszy rzut oka itp.) czyszczę najpierw CodeZapperem (patrz binaria grupy dejavu-l na yahoogroups), potem przetwarzam w Tradosie (o ile do tłumaczenia nadaje się IMHO słabo, to świetne narzędzie do przygotowania tekstu i korekty), a potem tłukę w DVX.
Jeżeli z czymkolwiek mam po drodze problemy, to zazwyczaj z Tradosem, ktory mi psuje czcionki.
PS.
Podstawowa sprawa.
Jesteś w stanie w tych przypisach wprowadzić polskie literki "z ręki"?
Zdrówkot
GG | | |
Oryctes wrote:
Używam DejaVu 7.0.284
Skąd Ty to wydobyłeś?![](https://cfcdn.proz.com/images/bb/smiles/icon_smile.gif)
Ta wersja DVX jest już mocno archaiczna, to jakoś koniec 2004 czy początek 2005, o ile pamiętam.
Jest bezpłatny upgrade do 7.5.303.
oraz Worda 97.
A Word 97 był taką dziwną hybrydą na pół Unicode, która opisywane przez Ciebie problemy wyprawiała bardzo często, o ile nie był nałożony SP3 lub SP3a, nie pamiętam już dokładnie.
Jaką masz wersję językową Windows i Office?
[...]
Próbowałem zastąpić je w Wordzie przy sprawdzaniu pisowni, ale Word wcale nie uznaje wyrazów z tymi znakami za błędne, tak jakby widział je jako prawidłowe litery.
Nie da się również zastąpić ich za pomocą funkcji "znajdź i zastąp", ponieważ przy wpisywaniu tych znaków do okienka "znajdź" uzyskuję normalną polską literę, której program nie znajduje w tekście: np. zamiast "Ż" mam taką górną kreskę, więc próbuję ją zastąpić wpisując w okno "znajdź" alt+cntrl+shift+z, bo taki jest skrót klawiaturowy dla tej kreski, ale zamiast kreski pojawia się właśnie "Ż". W przeciwieństwie do modułu sprawdzania pisowni, który traktuje górną kreskę jak "Ż", moduł wyszukiwania uznaje ją za inny znak, więc szukając "Ż" nie jestem w stanie wyszukać i zastąpić owych górnych kresek. Pozostaje mozolne wyszukiwanie i zastąpowanie wszystkich znaczków po jednym, co jest dość czasochłonne.
Wszystko jasne, to błąd Worda.
Coś mu się popieprzyło w stronach kodowych i miesza 1250, 1252 i Unicode.
IMHO, używając tylko Worda 97 sam tego nie naprawisz automatycznie, o ile dobrze pamiętam.
Zdrówkot
GG
[Edited at 2009-09-01 09:23 GMT] | | | Oryctes Local time: 11:06 angličtina -> polština + ... AUTOR TÉMATU serdeczne dzięki! | Sep 1, 2009 |
Bardzo wszystkim dziękuję za podpowiedzi - będę teraz wiedział gdzie szukać rozwiązania. Też tak sobie myślę, że to Word mi bruździ, i pewnie wypadałoby uaktualnić soft. Dziękuję i pozdrawiam | |
|
|
Oryctes wrote:
Bardzo wszystkim dziękuję za podpowiedzi - będę teraz wiedział gdzie szukać rozwiązania. Też tak sobie myślę, że to Word mi bruździ, i pewnie wypadałoby uaktualnić soft. Dziękuję i pozdrawiam
Jeśli możesz, wytrzaśnij skądś Office 2003.
DVX wpółpracuje z nim lepiej niż z Office 2007.
Zresztą większości znanych mi ludzi też z 2003 wygodniej.
Zdrówkot
GG | | | To report site rules violations or get help, contact a site moderator: You can also contact site staff by submitting a support request » Brak polskich znaków w eksporcie do Worda z DejaVu Pastey |
---|
Your smart companion app
Pastey is an innovative desktop application that bridges the gap between human expertise and artificial intelligence. With intuitive keyboard shortcuts, Pastey transforms your source text into AI-powered draft translations.
Find out more » |
| Trados Studio 2022 Freelance |
---|
The leading translation software used by over 270,000 translators.
Designed with your feedback in mind, Trados Studio 2022 delivers an unrivalled, powerful desktop
and cloud solution, empowering you to work in the most efficient and cost-effective way.
More info » |
|
| | | | X Sign in to your ProZ.com account... | | | | | |