Stránka do txt... Vyřešeno

Problémy s internetovými stránkami, internetovým prohlížečem atpod.

Moderátor: Mods_senior

jeninicicek
nováček
Příspěvky: 7
Registrován: září 15
Bydliště: Dolní Kounice
Pohlaví: Muž
Stav:
Offline

Stránka do txt...

Příspěvekod jeninicicek » 14 zář 2015 18:33

Nemáte někdo tip jak dostat jakoukoli stránku do txt, výsledné txt by mělo vypadat stejně jako, když stránku přes ctrl-a -c -v, vrazím do poznámkového bloku.
Zkoušel jsem nějaké html parsery, i projet html nějakým regulárním výrazem, ale prostě se mi pořád nedaří to vyčistit tak, jak přes ctrl-c -v.
Nechtěl bych na to nějakou aplikaci, ale spíš jak to řešit, kdybych si chtěl něco takového napsat... Jde to ctrl... nějak nasimulovat nebo tak něco bez otvírání stránek v prohlížeči?

Reklama
Uživatelský avatar
faraon
Master Level 8.5
Master Level 8.5
Příspěvky: 7397
Registrován: prosinec 10
Pohlaví: Muž
Stav:
Offline

Re: Stránka do txt...

Příspěvekod faraon » 14 zář 2015 18:43

Co prostě vzít znak po znaku pouze obsah BODY, vyházet všechny tagy, a pouze reagovat na odstavce a odřádkování?
"Král Lávra má dlouhé oslí uši, král je ušatec!

(pravil K. H. Borovský o cenzuře internetu)

jeninicicek
nováček
Příspěvky: 7
Registrován: září 15
Bydliště: Dolní Kounice
Pohlaví: Muž
Stav:
Offline

Re: Stránka do txt...

Příspěvekod jeninicicek » 14 zář 2015 21:26

Právě odfiltrovat vše, co se tam objeví je někdy problém(ne všichni píší stránky slušně :D), aneb jak píši parsery(např. jsoup) jsem zkoušel, ale nebyl jsem zrovna spokojen....

jeninicicek
nováček
Příspěvky: 7
Registrován: září 15
Bydliště: Dolní Kounice
Pohlaví: Muž
Stav:
Offline

Re: Stránka do txt...  Vyřešeno

Příspěvekod jeninicicek » 17 zář 2015 11:29

No nic, nakonec se mi to kombinací několika řešní podařilo....


Zpět na “Internet a internetové prohlížeče”

Kdo je online

Uživatelé prohlížející si toto fórum: Žádní registrovaní uživatelé a 8 hostů