Konverteerime .SUB/.IDX failid .SRT formaati

15.04.2010 @ 8:12:44 | Aarne Toompark | 1 kommentaar

Tihtipeale on internetist tÔmmatud filmil kaasas subtiitrid .SUB/.IDX formaadis. Mitmed programmid oskavad neid kohe kasutada (nÀiteks VLC) ja mÔned vajavad lisaprogrammide abi. See eest SRT formaadis subtiitritega saavad pea kÔik meediamÀngijad ilma mingeid lisasid nÔudmata hakkama.

Olen proovinud mitmeid programme ja lĂ”puks on minu lemmikuks saanud Subtitle Edit. Tema teisi vingeid vĂ”imalusi, peale .IDX/.SUB .SRT formaati konverteerimise pole ma proovinud aga need ei ole ka praegu teemaks. :) Subtitle Edit kasutab konverteerimiseks optilist mĂ€rgituvastust (OCR, Optical character recognition). See on kĂŒll natuke ebamugav aga paremat moodust ma leidnud ei ole.

Hakkame aga pihta:

Programm tuleb kasutamiseks lihtsalt lahti pakkida. Mingit installeerimist pole vaja.

KĂ€ivita programm ja sulle avaneb umbes niisugune aken:

Subtitle Edit: 1. ekraan

Pane paika filmi kaadrisagedus (1) ja vali teksti kodeeringuks ANSI (2).

Vajuta Open (3) ja nÀita programmile ette .SUB fail.

KĂŒsimusele "Import this VobSub subtitle" vasta "Yes" (4).

Subtitle Edit: 2. ekraan

Avanenud aknas vali sobiv keel (5) ning vajuta "OK" (6).

Subtitle Edit: 3. ekraan

Pane paika tuvastusmeetod (7), millist andmebaasi kasutada (8) ning vajuta "Start OCR" (9). Mina kasutan meetodit "OCR Via image compare", st vĂ”rreldakse subtiitris ja programmi andmebaasis olevaid mĂ€rke. Kui ette tuleb mĂ”ni tundmatu mĂ€rk, siis kĂŒsitakse minu kĂ€est, et millise mĂ€rgiga tegu on. Minu vastus salvestatakse samuti andmebaasi.

Subtitle Edit: 4. ekraan

JÀrgmisel pildil nÀidatakse mulle subtiitrist leitud tundmatut mÀrki kontekstis (10) ja eraldi (11). Minu sisestatud vastus lÀheb kasti 12 ning selle kinnitamiseks tuleb vajutada OK (13). Kui subtiitrites on ka kaldkirjas mÀrke, siis pane nende kÀsitsi tuvastamise ajaks linnuke kasti "Italic" ja Àra unusta seda pÀrast Àra vÔtmast.

NĂŒĂŒd tuleb aidata programmil subtiiter aidata lĂ”puni kodeerida, lĂ”puks "OK" vajutada ning .SRT formaadis subtiiter Fail menĂŒĂŒ -> "Save As..." kaudu salvestada.

Muud tÀhelepanekud:

  • Programmiga algselt kaasas olev andmebaas ei ole kuigi hea. Esimestel kordadel tuleb kĂ”ik suur- ja vĂ€iketĂ€hed, numbrid ja erimĂ€rgid (pĂŒstises ja kaldkirjas eraldi) programmile ette nĂ€idata. Hiljem lĂ€heb juba libedamalt.
  • Mina olen tavaliselt kĂ”ik "OCR Auto Correction" asjad Ă€ra keelanud.
  • Kui vĂ€hegi vĂ”imalik, siis kĂ€in ma programmi poolt toodetud .SRT faili Ă”igekirjakontrolliga ĂŒle - vahest kipuvad programmil ikka suured i’d ja vĂ€ikesed l’id segi minema.
  • Programm pakub vĂ”imalust kasutada Microsoft Office Document Imaging mĂ€rgituvastust. Ei saanud head tulemust.
  • OCR via Tessaract on uus ja kĂ”vasti parem meetod aga siis jÀÀb ikka spellerile vĂ€ga palju tööd. Sellega pole ma jĂ”udnud veel eriti mĂ€ngida.
  • Postituses kirjeldatud meetod on minul siiani kĂ”ige parema tulemuse andnud.
  • Programm vĂ”tab protsessorist, mis vĂ”tta annab. Arvutit pole kokku jooksutanud aga ventilaatorite kiire vuhin on tahtnud kasti pea laualt Ă”hku tĂ”sta.
  1. Üks kommentaar postitusele "Konverteerime .SUB/.IDX failid .SRT formaati"

  2. JĂ€rgmise sammuna vĂ”iks filmi ja subtiitrid pakkida ĂŒhisesse MKV (maktroska) konteinerisse, et subtiitrid ja film tulevikus lahku ei lĂ€heks.

    kirjutas offf 15.04.2010 @ 10:28

Kommenteeri postitust