Brak polskich znaków w eksporcie do Worda z DejaVu
Autor vlákna: Oryctes
Oryctes
Oryctes
Local time: 11:06
angličtina -> polština
+ ...
Aug 30, 2009

Właśnie wykonałem swoje pierwsze tłumaczenie z użyciem DejaVu i mam problem: po wyeksportowaniu tłumaczenia do Worda okazuje się, że w przypisach polskie litery zostały zastąpione rozmaitymi egzotycznymi znaczkami. Efekt ten nie występuje w tekście głównym, gdzie również występują polskie słowa. Byłbym zobowiązany za podpowiedź, jak uporać się z tym problemem.

 
Wolfgang Jörissen
Wolfgang Jörissen  Identity Verified
Belize
nizozemština -> němčina
+ ...
Trochę wiecej informacji poprosimy Aug 31, 2009

Normalne to nie jest, powinno to działac. Ale zanim ktokolwiek może Ci pomoc, proszę podac, z jaka wersja Word-a pracujesz, jaki filter używałeś do importowania i jaki build Deja Vu używaz. I - właśnie padnie mi do głowy: w jakiej czcionce oryginalny tekst był napisany w Wordzie? Może spróbuj zmienic czcionkę. A jeśli nic nie pomozy, to mogę na razie tylko sugerowac zastapic wszystkie błędne znaki (mówisz, że są one rozmaite, więc z paroma akcjami zastąpienia powinno się ... See more
Normalne to nie jest, powinno to działac. Ale zanim ktokolwiek może Ci pomoc, proszę podac, z jaka wersja Word-a pracujesz, jaki filter używałeś do importowania i jaki build Deja Vu używaz. I - właśnie padnie mi do głowy: w jakiej czcionce oryginalny tekst był napisany w Wordzie? Może spróbuj zmienic czcionkę. A jeśli nic nie pomozy, to mogę na razie tylko sugerowac zastapic wszystkie błędne znaki (mówisz, że są one rozmaite, więc z paroma akcjami zastąpienia powinno się zrobic) przez odpowiednie polskie.Collapse


 
Grzegorz Gryc
Grzegorz Gryc  Identity Verified
Local time: 11:06
francouzština -> polština
+ ...
Parę słów więcej... Aug 31, 2009

Wolfgang Jörissen wrote:

Normalne to nie jest, powinno to działac. Ale zanim ktokolwiek może Ci pomoc, proszę podac, z jaka wersja Word-a pracujesz, jaki filter używałeś do importowania

Normalnie importuję do DVX po przepuszczeniu przez Tradosa (bilingual RTF/DOC//TTX).
W zasadzie nigdy nie mam problemów, a RTF/DOC są zwykle lepsze niż obrabiane bezpośrednio w Tradosie.

i jaki build Deja Vu używaz.

Oczywiście ostatni jest najlepszy

I - właśnie padnie mi do głowy: w jakiej czcionce oryginalny tekst był napisany w Wordzie? Może spróbuj zmienic czcionkę.

Mhm.
To może być powód.
Jeżeli czcionka nie jest czcionką Unicode, nie ma siły, żeby polskie literki były wyświetlane poprawnie, to problem niezależny od narzędzia CAT.

A jeśli nic nie pomozy, to mogę na razie tylko sugerowac zastapic wszystkie błędne znaki (mówisz, że są one rozmaite, więc z paroma akcjami zastąpienia powinno się zrobic) przez odpowiednie polskie.

Mhm.
Albo, jeśli czcionka jest "dziwna" zamień ją globalnie na jakąś standardową wyglądającą podobnie, może wystarczy.

Zdrówkot
GG


 
Oryctes
Oryctes
Local time: 11:06
angličtina -> polština
+ ...
AUTOR TÉMATU
więcej informacji Aug 31, 2009

Używam DejaVu 7.0.284 oraz Worda 97. Nie dokonywałem żadnych zmian w filtrach, więc DejaVu wykorzystał zapewne filtr dla doc. bo taki format miał plik źródłowy. Stosowałem czcionkę New Times Roman. Co ciekawe, polskich liter (z wyjątkiem ó) brakuje tylko w przypisach.

Próbowałem zastąpić je w Wordzie przy sprawdzaniu pisowni, ale Word wcale nie uznaje wyrazów z tymi znakami za błędne, tak jakby widział je jako prawidłowe litery.
Nie da się również zas
... See more
Używam DejaVu 7.0.284 oraz Worda 97. Nie dokonywałem żadnych zmian w filtrach, więc DejaVu wykorzystał zapewne filtr dla doc. bo taki format miał plik źródłowy. Stosowałem czcionkę New Times Roman. Co ciekawe, polskich liter (z wyjątkiem ó) brakuje tylko w przypisach.

Próbowałem zastąpić je w Wordzie przy sprawdzaniu pisowni, ale Word wcale nie uznaje wyrazów z tymi znakami za błędne, tak jakby widział je jako prawidłowe litery.
Nie da się również zastąpić ich za pomocą funkcji "znajdź i zastąp", ponieważ przy wpisywaniu tych znaków do okienka "znajdź" uzyskuję normalną polską literę, której program nie znajduje w tekście: np. zamiast "Ż" mam taką górną kreskę, więc próbuję ją zastąpić wpisując w okno "znajdź" alt+cntrl+shift+z, bo taki jest skrót klawiaturowy dla tej kreski, ale zamiast kreski pojawia się właśnie "Ż". W przeciwieństwie do modułu sprawdzania pisowni, który traktuje górną kreskę jak "Ż", moduł wyszukiwania uznaje ją za inny znak, więc szukając "Ż" nie jestem w stanie wyszukać i zastąpić owych górnych kresek. Pozostaje mozolne wyszukiwanie i zastąpowanie wszystkich znaczków po jednym, co jest dość czasochłonne.
Collapse


 
Piotr Bienkowski
Piotr Bienkowski  Identity Verified
Polsko
Local time: 11:06
Člen (2005)
angličtina -> polština
+ ...
Jakieś 10 lat temu miałem podobny problem :-) Sep 1, 2009

Oryctes wrote:

Właśnie wykonałem swoje pierwsze tłumaczenie z użyciem DejaVu i mam problem: po wyeksportowaniu tłumaczenia do Worda okazuje się, że w przypisach polskie litery zostały zastąpione rozmaitymi egzotycznymi znaczkami. Efekt ten nie występuje w tekście głównym, gdzie również występują polskie słowa. Byłbym zobowiązany za podpowiedź, jak uporać się z tym problemem.


I po wypróbowaniu wszelkich możliwych konwersji wpadłem na pomysł hackerski. Zapisywałem plik jako RTF, otwierałem w edytorze tekstowym (wtedy był to NoteTab Pro) i zamieniałem coś w okolicach tekstu fcharset dla używanej w dokumencie czcionki. Tylko teraz już nie pamiętam, czy to była zamiana fcharset0 na fcharset250 czy fcharset252... Ale działało!

Oczywiście nikt nie powinien musieć wykonywać takich karkołomnych zabiegów, aby uzyskać dokument z poprawnie wyświetlanymi polskimi znakami. To była moja krótka przygoda z DejaVu, bo niedługo po "opatentowaniu" tego "wynalazku" pożegnałem się z tamtą firmą.

Pozdrawiam,

Piotr


 
Grzegorz Gryc
Grzegorz Gryc  Identity Verified
Local time: 11:06
francouzština -> polština
+ ...
Stare DV i RTF... Sep 1, 2009

Piotr Bienkowski wrote:


I po wypróbowaniu wszelkich możliwych konwersji wpadłem na pomysł hackerski. Zapisywałem plik jako RTF, otwierałem w edytorze tekstowym (wtedy był to NoteTab Pro) i zamieniałem coś w okolicach tekstu fcharset dla używanej w dokumencie czcionki. Tylko teraz już nie pamiętam, czy to była zamiana fcharset0 na fcharset250 czy fcharset252... Ale działało![/quote]
fcharset238
Mnie się zwykle nie chciało dłubać i otwierałem to w Wordzie 95, gdzie to było czytelniejsze.
To ostatni Word, który kanonicznie obsługuje RTF, więc służy mi interwencyjnie do dzisiaj

W dzisiejszym Wordzie można spróbować zaznaczyć wszystkie przypisy, znaleźć w menu lub na tych kretyńskich wstążkach opcję Popraw uszkodzony tekst, a jak Łotr już poprawi tekst, samemu ręcznie poprawić formatowanie, które Łotr przy okazji psuje.

Oczywiście nikt nie powinien musieć wykonywać takich karkołomnych zabiegów, aby uzyskać dokument z poprawnie wyświetlanymi polskimi znakami.

To akurat jest często sprawa nieprawidłowej struktury RTF, który np. pobiera domyślny charset z systemu i podobne.

To była moja krótka przygoda z DejaVu, bo niedługo po "opatentowaniu" tego "wynalazku" pożegnałem się z tamtą firmą.

DV3 i starsze pracowały na 256-znakowych stronach kodowych i to było rzeczywiście potwornie wkurzające, zwłaszcza w dokumentach wielojęzycznych, które na wyjściu nigdy nie były poprawne, jeśli w środku był zestaw Western, CE, greka itp.
Do tego stopnia, że w pewnym momencie w desperacji kupiłem SDLX, żeby tylko nie dotykać Tradosa, który w moich głównych parach językowych nie nadawał się wtedy domyślnie absolutnie do niczego.
Ale jak DVX się ustabilizował w końcu 2004, z przyjemnością SDLX wypieprzyłem, bo co to za CAT, który nie ma nawet fuzzy terminology recognition

Ogólnie, obecnie DVX wypuszcza RTF o niebo lepsze niż Trados rozumiany jako klasyczna nakładka na Worda, ponieważ nie próbuje "poprawiać" struktury pliku i nie gra nieudolnie na stylach.
Ma to tę przykrą konsekwencję, że jak na wejściu jest śmieć, nawet niewidoczny, może się ujawnić i na wyjściu.

Ja teksty, które podejrzewam o śmieciowość (czyli OCR, gnioty fatalnie sformatowane na pierwszy rzut oka itp.) czyszczę najpierw CodeZapperem (patrz binaria grupy dejavu-l na yahoogroups), potem przetwarzam w Tradosie (o ile do tłumaczenia nadaje się IMHO słabo, to świetne narzędzie do przygotowania tekstu i korekty), a potem tłukę w DVX.
Jeżeli z czymkolwiek mam po drodze problemy, to zazwyczaj z Tradosem, ktory mi psuje czcionki.

PS.
Podstawowa sprawa.
Jesteś w stanie w tych przypisach wprowadzić polskie literki "z ręki"?

Zdrówkot
GG


 
Grzegorz Gryc
Grzegorz Gryc  Identity Verified
Local time: 11:06
francouzština -> polština
+ ...
Wersje... Sep 1, 2009

Oryctes wrote:

Używam DejaVu 7.0.284

Skąd Ty to wydobyłeś?
Ta wersja DVX jest już mocno archaiczna, to jakoś koniec 2004 czy początek 2005, o ile pamiętam.
Jest bezpłatny upgrade do 7.5.303.

oraz Worda 97.

A Word 97 był taką dziwną hybrydą na pół Unicode, która opisywane przez Ciebie problemy wyprawiała bardzo często, o ile nie był nałożony SP3 lub SP3a, nie pamiętam już dokładnie.

Jaką masz wersję językową Windows i Office?

[...]

Próbowałem zastąpić je w Wordzie przy sprawdzaniu pisowni, ale Word wcale nie uznaje wyrazów z tymi znakami za błędne, tak jakby widział je jako prawidłowe litery.
Nie da się również zastąpić ich za pomocą funkcji "znajdź i zastąp", ponieważ przy wpisywaniu tych znaków do okienka "znajdź" uzyskuję normalną polską literę, której program nie znajduje w tekście: np. zamiast "Ż" mam taką górną kreskę, więc próbuję ją zastąpić wpisując w okno "znajdź" alt+cntrl+shift+z, bo taki jest skrót klawiaturowy dla tej kreski, ale zamiast kreski pojawia się właśnie "Ż". W przeciwieństwie do modułu sprawdzania pisowni, który traktuje górną kreskę jak "Ż", moduł wyszukiwania uznaje ją za inny znak, więc szukając "Ż" nie jestem w stanie wyszukać i zastąpić owych górnych kresek. Pozostaje mozolne wyszukiwanie i zastąpowanie wszystkich znaczków po jednym, co jest dość czasochłonne.

Wszystko jasne, to błąd Worda.
Coś mu się popieprzyło w stronach kodowych i miesza 1250, 1252 i Unicode.
IMHO, używając tylko Worda 97 sam tego nie naprawisz automatycznie, o ile dobrze pamiętam.

Zdrówkot
GG

[Edited at 2009-09-01 09:23 GMT]


 
Oryctes
Oryctes
Local time: 11:06
angličtina -> polština
+ ...
AUTOR TÉMATU
serdeczne dzięki! Sep 1, 2009

Bardzo wszystkim dziękuję za podpowiedzi - będę teraz wiedział gdzie szukać rozwiązania. Też tak sobie myślę, że to Word mi bruździ, i pewnie wypadałoby uaktualnić soft. Dziękuję i pozdrawiam

 
Grzegorz Gryc
Grzegorz Gryc  Identity Verified
Local time: 11:06
francouzština -> polština
+ ...
Office Sep 2, 2009

Oryctes wrote:

Bardzo wszystkim dziękuję za podpowiedzi - będę teraz wiedział gdzie szukać rozwiązania. Też tak sobie myślę, że to Word mi bruździ, i pewnie wypadałoby uaktualnić soft. Dziękuję i pozdrawiam


Jeśli możesz, wytrzaśnij skądś Office 2003.
DVX wpółpracuje z nim lepiej niż z Office 2007.
Zresztą większości znanych mi ludzi też z 2003 wygodniej.

Zdrówkot
GG


 


To report site rules violations or get help, contact a site moderator:

Moderátor/moderátoři tohoto fóra
Monika Jakacka Márquez[Call to this topic]

You can also contact site staff by submitting a support request »

Brak polskich znaków w eksporcie do Worda z DejaVu






Pastey
Your smart companion app

Pastey is an innovative desktop application that bridges the gap between human expertise and artificial intelligence. With intuitive keyboard shortcuts, Pastey transforms your source text into AI-powered draft translations.

Find out more »
Trados Studio 2022 Freelance
The leading translation software used by over 270,000 translators.

Designed with your feedback in mind, Trados Studio 2022 delivers an unrivalled, powerful desktop and cloud solution, empowering you to work in the most efficient and cost-effective way.

More info »