--------------------------------Linux Guide---------------------------------- by Ingo Blechschmidt (c) 2002 ----------------------------------------------------------------------------- ------------------------- Webschnapper (2) in Shell-Skript ------------------------- Son May 5 11:02:26 MEST 2002 ------------------------- Webschnapper w3m lynx grep web.de Internet Shell-Skript Skript cron crontab ----------------------------------------------------------------------------- Dieses Skript liefert ihnen jeden Morgen die aktuellen Nachrichten von WEB.DE brav in Ihre Mailbox. ----------------------------------------------------------------------------- Wie im ersten Artikel über Webschnapper prüft auch dieses Skript, ob es heute schon aufgerufen worde. Somit ist es dann möglich, mit einem kleinen Crontab-Eintrag das ganze zu automatisieren: --------CODE--------: crontab */5 * * * * /pfad/zu/den/nachrichten/nachrichten.sh --------/CODE-------- Übrigens wird das ganze auch archiviert (in /pfad/zu/den/nachrichten/jahr/monat/tag). Eine Beispiel-Mail sieht dann so aus: --------CODE--------: Beispiel Bundesliga Flugzeugabsturz Borussia Dortmund ist Flugzeug in Nigeria Deutscher Meister abgestürzt Parteitag Tarifrunde Grünen-Chefin Roth Bau-Tarifverhandlungen stimmt Partei auf in fünfter Runde Wahlkampf ein gescheitert Raumfahrt Tennis Ariane-Rakete bringt Schüttler erreicht Beobachtungs-Satelliten Finale in München ins All http://portale.web.de/Beruf/Tarifrunde/ http://portale.web.de/Schlagzeilen/Flugzeugabsturz/ http://portale.web.de/Schlagzeilen/Wahlkampf/Gruene/ http://portale.web.de/Sport/Fussball/Bundesliga/ http://portale.web.de/Sport/Tennis/ http://portale.web.de/Wissenschaft/Raumfahrt/ --------/CODE-------- Beim Skript müssen nur noch die Pfadangaben und die Befehle zum Verbinden und Trennen mit dem Internet geändert werden (Download): --------CODE--------: nachrichten.sh #!/bin/bash [ -e /pfad/zu/den/nachrichten/lock ] && exit; echo $$ > /pfad/zu/den/nachrichten/lock; PATH=/home/iblech/bin:/usr/local/bin:/usr/bin:/bin [ -e /pfad/zu/den/nachrichten/l ] || > /pfad/zu/den/nachrichten/l if [ ! "`cat /pfad/zu/den/nachrichten/l`" = "`date +%d`" ]; then ############################################### /usr/sbin/isdnctrl dial ippp0 date >> /pfad/zu/den/nachrichten/isdnlog sleep 4 HEUTE="/pfad/zu/den/nachrichten/`date +%Y/%m/%d`" NAME="`date +%s`" mkdir -p $HEUTE cd $HEUTE wget -O web.de.$NAME http://www.web.de/ /usr/sbin/isdnctrl hangup ippp0 ############################################### # Sam Mai 4 09:43:11 MEST 2002: Extension ({ and lynx} from Sam Mai 4 # 09:43:21 MEST 2002! { grep OK web.de.$NAME | w3m -T text/html | sed -e 's+\[..\]+ +g' -e 's*\[....\]* *g' -e 's*\** *g'; echo; echo; grep OK web.de.$NAME | lynx -force_html -dump /dev/stdin | grep http://portale | cut -d. -f 2,3,4 | sort | uniq; } | mail -s Aktuelle\ Nachrichten iblech gb date +%d > /pfad/zu/den/nachrichten/l fi rm /pfad/zu/den/nachrichten/lock --------/CODE-------- ----------------------------------------------------------------------------- ----------------------------------------------------------------------------- This document is distributed under the terms of the GNU Free Documentation License.