Děkuji všem za reakce, neměl jsem teď moc času, ale zkusím odpovědět nějak všem.
Vždycky se jedná jen o 2 soubory, které je potřeba sloučit. Nikdy není stejný počet řádků. Stejná slova nejsou ani na stejném řádku. Všechno je poházené a v EN souboru je třeba 3x méně slov než v tom českém, ale i přesto to potřebuju sloučit, abych měl výstup všechny české (pokud to jde, viz můj 1. příspěvek) a zbytek ty anglické, které v CZ souboru nebyly.
Ještě teda dodám, že jak máme vždycky začátek, ten je vždy velkými písmeny a může mít více slov, ty jsou ale vždy děleny podtržítkem, třeba THIS_IS_ THE_FIRST.
A pak je vždy mezera (TAB) a následují slova, která můžou být složena z více slov, ale už jen s mezerou.
Takže to může vypadat klidně takhle:Pro CZ: THIS_IS_ THE_FIRST Tohle je první
Pro EN: THIS_IS_ THE_FIRST This is the first
Výsledek bude tedy v CZ.
Vyzkouším co radíte a dám vědět.
Dodatečně přidáno po 33 minutách 59 vteřinách:EDIT:
_hm: tvůj script funguje dobře, ale ignoruje ty slova s mezerou, vypíše vždy jen první slovo a pak už vypisuje zase další řádek. Šlo by to nějak upravit? Nějak se mi to nedaří vypsat do souboru, mohl bys to prosím taky přidat?
EDIT2: Tak dobrý, už mi to ukládá do souboru. Ty mezery jsem vyřešil jinak.
Ještě poslední věc, pokud to teda půjde nějak... šlo by udělat, aby to česká slova, která nejsou zároveň i v anglickém souboru, ignorovalo a vůbec je nevypsalo? Že by to teda vypsalo jen ty, které jsou zároveň v CZ i AN souboru, ale ty, které jsou jen v AN a nejsou v CZ by zůstaly i tak.
Díky