Nemáte někdo tip jak dostat jakoukoli stránku do txt, výsledné txt by mělo vypadat stejně jako, když stránku přes ctrl-a -c -v, vrazím do poznámkového bloku.
Zkoušel jsem nějaké html parsery, i projet html nějakým regulárním výrazem, ale prostě se mi pořád nedaří to vyčistit tak, jak přes ctrl-c -v.
Nechtěl bych na to nějakou aplikaci, ale spíš jak to řešit, kdybych si chtěl něco takového napsat... Jde to ctrl... nějak nasimulovat nebo tak něco bez otvírání stránek v prohlížeči?
Stránka do txt... Vyřešeno
-
- nováček
- Příspěvky: 7
- Registrován: září 15
- Bydliště: Dolní Kounice
- Pohlaví:
- Stav:
Offline
Re: Stránka do txt...
Co prostě vzít znak po znaku pouze obsah BODY, vyházet všechny tagy, a pouze reagovat na odstavce a odřádkování?
"Král Lávra má dlouhé oslí uši, král je ušatec!
(pravil K. H. Borovský o cenzuře internetu)
(pravil K. H. Borovský o cenzuře internetu)
-
- nováček
- Příspěvky: 7
- Registrován: září 15
- Bydliště: Dolní Kounice
- Pohlaví:
- Stav:
Offline
Re: Stránka do txt...
Právě odfiltrovat vše, co se tam objeví je někdy problém(ne všichni píší stránky slušně
), aneb jak píši parsery(např. jsoup) jsem zkoušel, ale nebyl jsem zrovna spokojen....

-
- nováček
- Příspěvky: 7
- Registrován: září 15
- Bydliště: Dolní Kounice
- Pohlaví:
- Stav:
Offline
Re: Stránka do txt... Vyřešeno
No nic, nakonec se mi to kombinací několika řešní podařilo....
Zpět na “Internet a internetové prohlížeče”
Kdo je online
Uživatelé prohlížející si toto fórum: Žádní registrovaní uživatelé a 6 hostů