Web scraping - Zählerstände von Druckern ermitteln

  • Moin moin,

    ich würde gerne die Druckerstatistiken unserer Canon (LBP6670dn) Geräte automatisiert abfragen.

    - IPP war mein erster Versuch leider scheinen unsere Geräte darüber keine Infos auszuspucken, wie viele Seiten schon gedruckt wurden. Mehr als den Gerätenamen bekomme ich da kaum raus.
    - SNMP war dann auch eine Idee aber die MIB-Files von Canon sind wohl nur den "Premium-Entwicklern" vorbehalten - konnte jedenfalls keine freie Canon-MIB-Datei finden und mit den Standards war auch nichts zu finden.

    Sollte jemand noch zu den oben erwähnten Möglichkeiten Infos haben, nehme ich diese gerne an, wie zum Beispiel die OID :)

    So, da ich über IPP und SNMP nicht zum gewünschtem erfolg kam, dachte ich mir, versuchs doch einmal mit Web-Scraping. Der Anfang ist schnell getan und die Login-Seite ist auch schnell überwunden aber ab jetzt stehe ich vor einem anderem Problem.

    Nachdem ich die Loginseite mit:

    Code
    If $oInput.type = "submit" And $oInput.value = "Login" Then _IEAction($oInput, "click")


    überwunden habe und daraufhin auch die Infoseite des Druckers sehe, referenziert das IEObject weiterhin auf die Loginseite. Wenn ich mir nämlich nach dem Login mit:

    Code
    _IEBodyReadHTML($oIE)

    den Quelltext anzeigen lasse, ist hier nur der Quellcode der Loginseite zu sehen, jedoch nicht der der Hauptseite. Somit komme ich nun auch nicht weiter zur nächsten Seite um dann letztendlich die Zählerstände abzufragen.

    Wahrscheinlich scheitere ich nur an einem Kieselstein aber dieser scheint im Moment unüberwindbar zu sein :D - Über Hilfe würde ich mich sehr freuen.


    Gruß


    Nachtrag 24.04.2015
    Ich habe das Problem "gefunden". Und zwar liegt dies an den Sicherheitseinstellungen des IE. Als ich die Druckerwebsite zu den Vertrauenswürdigen-Seiten hinzugefügt habe, konnte ich wieder auf das Object zugreifen und die Werte auslesen. Da für die vertrauenswürdigen Seiten des IE kein "Geschützer Modus" aktiv ist, liegt dies evtl auch daran. Müsste man mal testen. Aber jetzt kann ich immerhin weitermachen - hat mich ja schon genug Zeit gekostet...


    Gruß

    Einmal editiert, zuletzt von Chondremos (24. April 2015 um 14:57)

  • Dies hatte ich auch probiert aber ich habe einfach nie Zugriff auf das Objekt bekommen bzw. es wurde ungültig und damit könnte ich auf nichts mehr prüfen. Ich hatte auch versucht mir das Objekt neu über das Window-Handle zu holen, was auch nie ging. Erst als ich die entsprechenden Adressen zu den vertrauenswürdigen Seiten hinzugefügt habe, ging es.

    Naja, jetzt geht es und ich kann schön von meinen 2x Druckern die gedruckten Seiten SW, Farbe, Scans und Faxeingänge in eine CSV-Datei schreiben. Die nächste Abrechnung kann kommen :D