nntp2http.com
Posting
Suche
Optionen
Hilfe & Kontakt

<2005-03-22> CPU+Mainboard FAQ - Kapitel 10/14 - Fehlersuche

Von: CPU und Mainboard FAQ Team (dchcm@dch-faq.de) [Profil]
Datum: 03.06.2010 02:00
Message-ID: <cpu+mainboard-faq-kapitel10-03.06.2010@news.dch-faq.de>
Followup-to: de.comp.hardware.cpu+mainboard.misc
Newsgroup: news.answers de.answers de.comp.hardware.cpu+mainboard.uebertakten de.comp.hardware.cpu+mainboard.intel de.comp.hardware.cpu+mainboard.amd de.comp.hardware.cpu+mainboard.misc
Archive-name: de/comp/hardware/cpu+mainboard/kapitel_10
Posting-frequency: monthly
Last-modified: 2005-03-22
URL: http://dch-faq.de/kap10.html
Disclaimer: Approval for *.answers is based on form, not content.

10. Fehlersuche
==============

In den seltensten Fällen laufen selbst zusammengestellte Rechner auf
Anhieb ohne Probleme. Das betrifft sowohl den durchschnittlich
gebildeten Laien (juristisch für "DAU") als auch den Hobby-Bastler
oder sogar den professionellen Systemintegrator. Selbst bei neu
erworbenen Komplettsystemen ist man nicht vor Problemen sicher.

Die Gründe dafür sind so vielfältig, dass es weder durchschlagende
Patentrezepte noch FAQs gibt, die das auf die Schnelle ändern. Die
verwendete Hardware und Software ist mitlerweile so komplex, dass es
beinahe unmöglich erscheint, kompetenten und wirklich helfenden Rat
zu bekommen.

Auch wir FAQ´ler können diesen Missstand selbstverständlich nicht
beheben. Trotzdem wollen wir die User nicht ganz im Regen stehen
lassen, und wenigstens einige Tips weitergeben, wie man Problemen auf
die Spur kommen kann. Eine Garantie gibt es dafür natürlich nie.

Die Fehlersuche dieser FAQ bedient themengemäss beinahe
ausschliesslich die Hardware; lediglich in Kapitel 11 findet ein
kleiner Exkurs zum Thema "Treiber" statt. In den einzelnen Kapiteln
befinden sich bereits häufig Anleitungen zur Fehlersuche, auf die
hiermit nocheinmal nachträglich hingewiesen werden soll.


10.1 Fehlererkennung
===================

Bevor man einen Fehler beheben kann, muss man ersteinmal wissen, dass
überhaupt ein Fehler vorliegt. Wie so vieles hört sich dies trivial
an; in der Praxis gibt es allerdings Scharen von Usern, die
vielleicht schon sehr lange auf Fehlern sitzen und/oder gar nicht
wissen, dass sie einen Fehler im System haben ("Unwissenheit ist
etwas Kostbares" - The Matrix). Das heisst jedoch nicht, dass man
sein System so lange auf den Kopf stellen soll, bis man endlich einen
Fehler gefunden (oder damit provoziert) hat - wer keine Probleme hat
muss nicht unbedingt danach suchen :-).

Das Hauptproblem bei auftretenden Fehlern ist es, sie richtig
einzuordnen. Grundsätzlich gilt: Ein Fehler ist kein Fehler. Das
heisst soviel wie: Wenn das System mal abstürzt oder hängenbleibt ist
das kein Anzeichen dafür, dass wirklich ein Defekt im eigentlichen
Sinne vorliegt. Häufig handelt es sich bei nicht wiederkehrenden
Fehlern um schlampig programmierte Software oder eben treiberseitige
Probleme. Häufig sind auch solche Instabilitäten in den Griff zu
bekommen; hier sei auf die Newsgruppen der Hierarchie
de.comm.software.ALL und de.comp.os.ALL verwiesen. Speziell zu
Microsoft Windows 9x und NT gibt es bereits hilfreiche FAQs, wenn es
um das Lösen von Problemen geht: http://www.winfaq.de,
http://www.wintotal.de und http://www.windows2000helpline.de seien
hier nur stellvertretend für die Vielzahl an Webseiten genannt, die
sich mit den Betriebssystemen auseinandersetzen.

Für Hardware'ler richtig interessant wird es eigentlich erst, wenn
Fehler gehäuft oder gar reproduzierbar auftreten. Hat man
Softwarefehler zum grössten Teil bzw. so weit es geht ausgemerzt,
wird es Zeit über hardwareseitige Fehlerquellen nachzudenken, derer
es sehr viele gibt. In dieser FAQ soll das Hauptaugenmerk auf die
systematische Fehlereingrenzung gelegt werden.


10.2 Fehlereingrenzung
=====================

Hat man einen Fehler vorliegen, der häufiger auftritt, muss man sich
Gedanken um die Fehlerursache machen. Zum Auffinden des Fehlers gibt
es 3 Strategien:

1. Intuition: Haben wohl nur die Gewohnheitsschrauber, für den Laien
also nicht von Nutzen - es sei denn, man hat grade einen solchen
zur Hand :-)

2. Random choice: Man sucht wild drauf los, ohne sich grosse Gedanken
um eine Systematik zu machen. Nach den Gesetzen der Statistik kann
man das Problem extrem schnell finden - oder aber daran für immer
verzweifeln.

3. Systematische Fehlersuche: Wenn überhaupt wohl die sicherste
Methode, um einen Fehler _wirklich_ zu finden, und das in
vertretbarer Zeit.

Falls sich der Leser der FAQ jetzt für Punkt 3 entschieden hat, so
soll in den folgenden Punkten aufgezeigt werden, wie man vorgehen
kann.


10.2.1 Die Minimalkonfiguration
==============================

Eine effektive Fehlereingrenzung fängt mit dem Herstellen der sog.
Minimalkonfiguration an. Hier wird der Rechner von allem befreit,
was für den blossen Betrieb nicht notwendig ist. Auf dem Mainboard
sollte lediglich die CPU samt Kühler und die Grafikkarte installiert
sein - nicht zu vergessen der Stecker für die Stromzufuhr. An das
Mainboard angeschlossen werden nur noch die Tastatur und der
Monitor. Alle Onboard-Komponenten sollten via Jumper oder BIOS
abgeschaltet werden. Auch die Laufwerke sollten auf ein absolutes
Minimum reduziert werden oder komplett abgeklemmt werden, um einen
Fehler z.B. der Bootplatte feststellen zu können. Alle Einstellungen,
die zum Übertakten dienen, sollten abgestellt werden, der Speicher
sollte mit den langsamsten Timings angesprochen werden. Falls
mehrere Speicherbausteine im System sind, sollte man alle bis auf
ein Modul herausnehmen (bis auf Systeme, die auf mehrere Bausteine
bestehen, wie z.B. die 2-Kanal-Rambus Chipsätze i840, i850(E) und
i860). Man kann sogar die Tastatur (bei abgeschaltetem PC) entfernen.
Dann sollte nur eine Fehlermeldung des BIOS erscheinen.

Der so konfigurierte PC sollte nun zumindest bis ins BIOS kommen.
Läuft auch das Betriebssystem an (bei installierten Laufwerken),
kann man sich mit den deinstallierten Komponenten beschäftigen und
somit in Kap. 10.2.2 weiterlesen.

Kommt man nicht in das BIOS oder das Betriebssystem, kann es
noch mehrere Fehlermöglichkeiten geben. Um Fehler beim RAM, BIOS
oder der CPU (inkl. Kühlung und Übertakten) zu erkennen, sei auf
die entsprechenden Kapitel der FAQ verwiesen (CPU: Kap. 3,
Kühlung: Kap. 4, Übertakten: Kap 9, BIOS: Kap. 7, RAM: Kap. 8).

Ein weiterer potentieller Störenfried in der Minimalkonfiguration
ist die AGP- bzw. PCI-Grafikkarte. Da defekte AGP- und PCI-Karten
den kompletten PCI-Bus stören können, sind die Symptome für ein
defektes Gerät äusserst unterschiedlich. Auch hier hilft häufig
eine alte oder geliehene, fehlerfreie Grafikkarte. Wer noch einen
ISA-Slot auf seinem Board besitzt, sollte eine funktionierende
ISA-Grafikkarte einbauen, um Konflikte mit dem PCI-Bus komplett
ausschliessen zu können.

Ist der Fehler immer noch nicht zu finden, wird die Diagnose
zugegebenermassen schwierig. Bevor man aber ein Defekt des
Motherboards als Möglichkeit in Betracht zieht (was sehr wohl möglich
ist), sollte man nochmals sämtliche Steckverbindungen gründlich
überprüfen. Im Defektfall aber lässt sich der Fehler nur durch einen
qualifizierten Fachmann herausfinden.


10.2.2 Das Netzteil
==================

Eine weitere sehr häufige Fehlerquelle sind die Netzteile (NT). Vor
allem moderne CPUs brauchen sehr viel Strom, und in aufgerüsteten
PCs stecken meist nur alte und/oder zu schwache Netzteile. Beim
Netzteil lohnt es sich nicht, irgendwelche Kompromisse einzugehen.
Auch neue (oder neuwertige) 300W Netzteile können auf den einzelnen
Leitungen zu schwach sein. Deswegen sollte man immer auf Marken-
Netzteile (Enermax, ChannelWell, Fortron etc.) wert legen. Marken-NT
halten sie sich an die Vorgaben von AMD, auf der +3.3V-Leitung
mindestens 20A und auf der +5V-Leitung mindestens 30A liefern zu
können. Netzteile, die diese Spezifikation nicht erfüllen, sollte man
gar nicht mehr neu erstehen.
Neuere Systeme (AMD Athlon 64 und Opteron sowie Intel Pentium 4)
beziehen den Strom für die CPU über die 12V-Leitung, weshalb auch
hier die Stromstärken nicht zu gering bemessen sein sollten. Dies
gilt insbesondere für Systeme, die 2 PCIe Grafikkarten (SLI)
aufnehmen. Wer sich heutzutage ein neues NT kauft, sollte sich daher
überlegen, folgende Eckdaten einzuhalten: 28A auf 3.3V, 30A auf 5V
und 15A auf 12V. Diese Konfiguration wird von AMD als
(unverbindliches) Beispiel angegeben - siehe:
http://www.amd.com/us-en/Processors/TechnicalResources/0,,30_182_869_4348^4358,00.htm
Für SLI-Systeme sollten sogar 18A über die 12V-Schiene fliessen
können. Nur wer sehr viele Laufwerke oder mehrere CPUs hat, braucht
eventuell noch stärkere Netzteile.

Aber nicht nur die Belastbarkeit ist entscheidend: Beim Strom gibt
es auch Schwankungen und Rauschen der Signale, was sich auf alle
Komponenten auswirkt, da ja alle (evtl. über den Umweg Mainboard)
vom NT bedient werden. Auch deshalb ist ein Marken-NT anzuraten.
Hinzu kommt der häufig schlechte Wirkungsgrad von Billig-Netzteilen,
die dann hauptsächlich eins produzieren: Wärme. Ausserdem sollte man
sich auf den Webseiten der CPU-Hersteller kundig machen (wie z.B.
bei AMD unter http://www1.amd.com/athlon/config), welche Netzteile
dort empfolen werden. In der Zeitschrift c't finden sich gleich
mehrere Tests zum Thema Netzteile, so z.B. in c't 10/01, Seite 196ff
oder auch in der c't 13/00, Seite 100ff. Auch dort wird darauf
hingewiesen, dass schlechte Netzteile sehr häufig der Grund für
Fehler sind.

Bei älteren Systemen, die noch nicht über den 4-poligen
ATX12V-Power-Stecker versorgt werden, ist die 12V-Schiene oft
unkritisch. Sämtliche Laufwerke, welche den "großen" Power-Stecker
haben, werden durch sie versorgt. Der kleine Power-Stecker, wie er
bei Floppys zu finden ist, bringt zusätzlich noch eine 5V-Ader mit.
Hat man keinen Server mit sehr hoher Anzahl von Laufwerken, ist es
auch für einfache Netzteile kein Problem, diese Laufwerke
ausreichend zu versorgen.
Seit der ATX12V-Spezifikation, wie sie von Intel für den Pentium 4
vorgestellt wird, wird aber auch das Motherboard samt CPU verstärkt
mit 12V über einen zusätzlichen 4-poligen (ATX12V-) Stecker
versorgt, da die maximal abgebbare Leistung an 3.3V und 5V kaum mehr
ausreicht, um moderne Intel (Pentium 4, XEON) oder AMD-CPUs (Athlon
64, Opteron) zu betreiben. Bis ATX 2.1 besaß der alte
ATX Main-Power-Stecker (20 Pin) zum Mainboard nur eine 12V-Leitung,
was sich als unzureichend erwiesen hat. Mit ATX 2.2 hat der
Main-Power-Stecker zwar 24 Pins und nun zwei 12V-Leitungen,
trotzdem wird der 4-polige 12V-Stecker noch für die CPU- und
Mainboard-Lasten verwendet. Der zusätzliche Pin im 24-poligen
ATX-Stecker ist vornehmlich für den Leistungsbedarf stromhungriger
PCI-Express-Karten gedacht, die sich bis zu 75W an Leistungsaufnahme
genehmigen dürfen.
Die Stecker von ATX 2.2 passen mechanisch auch auf den neuen
BTX-Standard, der in der Version 1.0 vorliegt.

Eine Übersicht, in welchem Bereich die Spannungen und Ströme laut
ATX- und BTX-Spezifikation (Version 2.2 und 1.0, zu finden unter
http://www.formfactors.org/) liegen sollten, gibt folgende Tabelle:

Ausgang  | Toleranz | U(min)|U(norm)| U(max)| I(min)|I(norm)| I(peak)
|   [%]    |  [V]  |  [V]  |  [V]  |  [A]  |  [A]  |  [A]
==========+==========+=======+=======+=======+=======+=======+=======
+ 12 V   | +/- 5%(1)|+11.40 |+12.00 |+12.60 |   0.0 |  12.0 |  13.0
----------+----------+-------+-------+-------+-------+-------+--------
+  5 V   | +/- 5%   | +4.75 | +5.00 | +5.25 |   1.0 |  30.0 |   -
----------+----------+-------+-------+-------+-------+-------+--------
+3.3 V   | +/- 5%   | +3.14 | +3.30 | +3.47 |   0.3 |  20.0 |   -
----------+----------+-------+-------+-------+-------+-------+--------
- 5 V (2)| +/-10%   | -4.50 | -5.00 | -5.50 |   0.0 |  -0.3 |   -
----------+----------+-------+-------+-------+-------+-------+--------
- 12 V   | +/-10%   |-10.80 |-12.00 |-13.20 |   0.0 |  -0.8 |   -
----------+----------+-------+-------+-------+-------+-------+--------
+  5 V   | +/- 5%   | +4.75 | +5.00 | +5.25 |   0.0 |   1.5 |   2.5
(Standby) |          |       |       |       |       |       |
----------+----------+-------+-------+-------+-------+-------+--------

(1) Bei Maximallast darf die +12V-Schiene um bis zu +/- 10%
schwanken.
(2) Ab ATX 2.2 darf die -5 V Leitung wegfallen und ist nur noch
optional.

Die Tabelle stellt nur eine Beispielkonfiguration dar, mit der evtl.
High-End-Systeme mit 2 PCIe Grafikkarten nicht versorgt werden können.

Das Netzteil als Ursache zu identifizieren ist nicht trivial, dies
geht i.d.R. nur mit entsprechender Messtechnik. Lediglich die
Funktionen des Hardwaremonitoring können durch schwankende oder zu
niedrig liegende Spannungen auf einen Defekt des Netzteiles
aufmerksam machen. Gibt es hier keine Anzeichen für Probleme, bleibt
einem der Gang zum Fachmann nur dann erspart, wenn man leihweise ein
Ersatznetzteil zur Verfügung hat und einbauen kann. Wenn man nun ein
Netzteil besitzt, welches überall Empfehlungen bekommen hat, aber
trotzdem das Netzteil in Verdacht hat, sollte man im BIOS oder per
Monitoring-Software die Spannungen (vor allem +3.3V und +5V) auf
Stabilität beobachten. Sinkt eine Spannung stark ab, ist dies ein
sicheres Zeichen für ein Problem. Dies kann einerseits eine
Überlastung des Netzeils bedeuten oder andererseits auf
Kontaktprobleme am ATX-Motherboard-Stecker hindeuten. Hier sollte man
(bei abgeschaltetem Rechner) den Stecker überprüfen. Sollte er z.B.
aussergewöhnlich warm sein, ist das ein sicheres Zeichen für ein
Kontakproblem. Die Kontakte dürfen auf keinen Fall korrodiert oder der
Stecker schon angeschmort sein.
Leider muss an dieser Stelle aber auch angemerkt werden, dass die
Angaben der Mainboard-Messwerte oft unzuverlässig sind; hier sind
durchaus Fehler von über 1% im Bereich des möglichen. Um Strom und
Spannung exakt zu messen, bedarf es daher ggf. geeigneter externer
Messgeräte (z.B. Multimeter etc.), deren Handhabung ein Fachmann
übernehmen sollte.


10.2.3 Wiedereinbau der Komponenten
==================================

Sind in der Minimalkonfiguration keine Fehler mehr aufgetreten, kann
man mit dem Wiedereinbau der einzelnen Komponenten beginnen.
Zunächst sollten aber die Onboard-Komponenten (Controler, Sound,
Modem, LAN etc.) wieder in Betrieb genommen werden, da auch diese
durchaus Fehler verursachen können.
Danach sollten eventuelle Controller und die daran angeschlossenen
Laufwerke installiert werden. Treten hier Probleme auf, kann man die
Onboard-Schnittstellen wieder abschalten, um zu sehen, ob es hier
Unverträglichkeiten und Konflikte gibt. Ist dies nicht der Fall,
sollten die Laufwerke überprüft und der Controller testweise
ausgetauscht werden.
Treten keine Probleme auf, kann man die weiteren Steckkarten
einsetzen. Wichtig ist, dass der Einbau der Karten nicht wahllos,
sondern wohl durchdacht geschieht. Die Steckkarten sind so
anzuordnen, dass Resourcen-Konflikte so weit wie möglich vermieden
werden. Liegen solche Resourcen-Konflikte vor, sei hier auf das
Kapitel über IRQs (Kap. 6) verwiesen. Als Faustregel sollte man
"unwichtigere" Komponenten zuletzt einbauen. (Also: Controler
zuerst - Sound- und TV-Karten zuletzt). Auch sollte man lieber
vorsichtig und langsam vorgehen - d.h.: Immer nur eine Komponente -
auch wenn der Fehler offensichtlich nicht damit zusammen zu hängen
scheint. Auch sollte man stets das Betriebssystem komplett booten
und die "neue" Komponente vollständig installieren.

In der Regel lässt sich durch den nach und nach erfolgenden Einbau
der Karten der "Übeltäter" ausfindig machen. Manchmal reicht zum
Lösen eines Problems z.B. ein Wechsel des gewählten Slots, in
anderen Fällen kommt man nicht um den Austausch der Komponente
herum. Bei Defekten vor dem Ablauf eines halben Jahres nach Kauf
des Gerätes kann man den Händler um Reparatur oder Wandlung bitten,
danach greift ggf. noch die Garantie der Hersteller.

Ist trotzdem der Fehler nicht gefunden, sollte man sehr genau
beobachten, wann und wie ein Fehler auftritt. Da niemand perfekt
ist, hilft dann oft die Hilfe eines (hardwarekundigen) Bekannten
oder eine Anfrage in der geeigneten Newsgroup. Merke: Umso genauer
das Problem beschrieben werden kann, desto wahrscheinlicher ist es,
dass ein anderer die richtigen Schlüsse ziehen und helfen kann.


10.3 Oft auftretende Fehler
==========================

In den vorangegangenen Kapiteln wurden einige grundsätzliche
Lösungsprinzipien vorgestellt. Hier soll es nun etwas tiefer ins
Detail gehen und einige oft auftretende Fehler sollen beleuchtet
werden. Eines vorweg: Die Anzahl von möglichen Fehlern ist gradezu
erdrückend groß, sodass hier wirklich nur exemplarisch einige Dinge
aufgeführt werden können.

10.3.1 Der PC rührt sich nicht
=============================

Sollte der PC beim Drücken des Power-Tasters keinerlei Regung zeigen,
so könnten folgende Probleme aufgetreten sein:

10.3.1.1 Eine wichtige Komponente ist nicht richtig eingesteckt
==============================================================

Rüste unbedingt auf ein Minimalsystem um, wie in Kapitel 10.2.1
beschrieben. Überprüfe alle Steck-Verbindungen. Besonderes
Augenmerk ist auf den korrekten Sitz der CPU zu legen. Die CPU muss
fest im Sockel sitzen und der Kühlkörper muss plan aufliegen. Dabei
darf kein schräger Druck ausgeübt werden - besonders nicht durch den
Kühlkörper, denn die CPU könnte zerbrechen. RAM und Grafikkarte
sollten tief im Sockel sitzen. Es sollte ein Geräusch des Einrastens
zu hören sein. Bei der Grafikkarte ist darauf zu achten, dass die
abgewinkelte obere Kante der Slotblende nicht verhindert, dass die
Grafikkarte tiefer in den Slot rutschen kann.

10.3.1.2 Es liegt kein Lüfter-Tacho-Signal an
============================================

Einige Motherboards verlangen nach einem Tacho-Signal des
CPU-Lüfters, damit sie davon ausgehen können, dass er aktiv ist.
Hier ist darauf zu achten, dass der korrekte Lüfter-Anschluss auf
dem Motherboard verwendet wurde (also der CPU-Lüfter-Anschluss für
den CPU-Lüfter und nicht etwa ein Gehäuse-Lüfter-Anschluss). Es gibt
Lüfter, die kein Tacho-Signal liefern. Hier muss man zwangsweise auf
einen Lüfter umsteigen, der dies kann. Ein Indiz(!), dass der Lüfter
ein Tacho-Signal liefern kann, ist das Vorhandensein von 3 und nicht
nur von 2 Versorgungskabeln.
Ausserdem sollte man sich vor dem Lüftereinbau vorgewissern, dass
der Lüfter nicht mehr Strom zieht, als das Board liefern kann. Hier
hilft ein Blick ins Handbuch weiter.

10.3.1.3 Es gibt Probleme beim Netzteil
======================================

Der korrekte Sitz des ATX-Power-Steckers auf dem Mainboard ist zu
prüfen. Weiterhin sollte das Netzteil die Mindestanforderungen
erfüllen (die in Kapitel 10.2.1 genannt wurden), damit man davon
ausgehen kann, dass die Last nicht zu einer Notabschaltung führt.
Selbstverständlich sollte auch der echte Power-Schalter am Netzteil
eingeschaltet sein ;-). Läuft das Netzteil nicht an, so sollte man
sich vergewissern, dass es überhaupt funktioniert. Am sichersten ist
man, wenn man ein garantiert funktionierendes Netzteil z.B. von
einem Bekannten leihweise bekommen könnte. Hartgesottene Bastler(!)
können auch mal versuchen beim Netzteil _ohne_ jegliche Last die
Power_On_Leitung mit Masse dauerhaft zu brücken (Pin 14 und z.B.
Pin 15). Allen anderen ist davon besser abzuraten.

10.3.1.4 Gestern ging er noch...
===============================

Oft ist es Dreck oder ein Anstossen am PC (nach einem kleinen
Transport z.B.), der den Kontakt von Bauteilen zunichte macht.
Lösungsansatz: Alles raus - Dreck ausblasen - alles wieder rein.
Netzteile bieten oft einen gewissen Überspannungsschutz. Sollte also
eine Überspannung zur Notabschaltung des Netzteiles führen, dann wird
das Netzteil beim folgenden Versuch, einzuschalten nicht starten.
Hier hilft: Warten, bis die Sicherung abgekühlt ist und echte
Trennung des Netzteiles von der Versorgungsspannung. Ist der Rechner
etwas älter (und man hat keine Garantier mehr darauf), so kann der
_versierte_ Bastler auch mal das Netzteil öffnen (Natürlich nur bei
vollständiger Trennung vom Netz!), um nachzusehen, ob evtl. Staub zu
einem Kurzschluss führt, ein Bauteil "ungesund" oder verschmort
aussieht oder eine Schmelzsicherung zerstört wurde. Allen anderen
Bastlern ist anzuraten, testweise ein anderes Netzteil zu verwenden.

10.3.1.5 Der Rechner will erst angewärmt werden
==============================================

Bei diesem verzwickten Problem hat sich bis jetzt noch keine
eindeutige Usache herauskristallisiert. Ein paar Lösungsansätze
sind:
- Kalte Lötstelle: Wenn man nicht mit einer Lupe akribisch
danach sucht, wird man selten eine Chance haben, eine solche
kalte Lötstelle zu finden - es gibt einfach zu viele
Möglichkeiten.
- Kontaktprobleme in Verbindung mit Verschmutzung: Hier hilft
nur eine komplette Demontage und ein Ausblasen des Staubes.
- Defektes Netzteil: Es wurde davon berichtet, dass bei einem
Netzteil, dessen Elektrolyt-Kondensatoren geplatzt und
ausgelaufen waren, obiges Fehlerbild auftrat.
- Es gibt Boards, wo die Elektrolyt-Kondensatoren zu heiß werden.
Vermehrt wurde diese bei ABIT-Motherboards mit
Jackson-Kondensatoren beobachtet, wenn diese non-stop über
mehrere Monate laufen. Meist beginnt sich das Fehlerbild
langsam zu zeigen. Oft sind Abstürze die ersten Anzeichen und
später muss der PC mit untertaktetem FSB angewärmt werden.
(Diese Untertaktung hat den Sinn, dass dann weniger Strom
fließt und die Kondensatoren weniger belastet werden.)

10.3.1.6 Defekte Kondensatoren
=============================

Im Netzteil und auf dem Motherboards sind zahlreiche Kondensatoren
verbaut, die meist zur Regelung der Versorgungsspannung benötigt
werden. Durch die recht beachtlichen Ströme, die in PCs fließen, sind
diese Bauteile hohen Belastungen ausgesetzt. Weiterhin führt Hitze zu
einer schnelleren Alterung dieser Kondensatoren. Immer wieder sparen
die Hersteller von Netzteilen und Motherboards bei den Kondensatoren,
sodass es nach längerer Betriebszeit dazu kommt, dass die
Kondensatoren eine Beule bekommen, reißen und das Elektrolyt ausläuft
oder gar explosionsartig platzen.

Die praktischen Resultate derartiger Defekte sind
* Totalschaden (des Netzteil / Motherboard läßt sich nicht starten)
* schlechtes Startverhalten (Kapitel  10.3.1.5)
* sporadische Abstürze (besonders, wenn starke Lastwechsel auftreten,
z.B. wenn die CPU aus dem Ruhezustand (HLT) aufwacht)

Die Lösungen für das Problem sind in erster Linie das Geltendmachen
von Garantieansprüchen oder der komplette Austasuch der Komponente.
Versierte(!) Bastler können auch zum Lötkolben greifen und ein
Ersatz-Kondensator statt des defekten einlöten. Dabei ist darauf zu
achten, dass der Ersatz-Kondensator schaltfest ist, Temperaturen bis
etwa 100°C verträgt und mindestens die selbe Kapazität hat. (Eine
geringfügig höhere Kapazität als der Original-Kondensator soll meist
kein Problem darstellen). Wenn noch die komplette Modellbezeichnung
des Original-Kondensators zu erkennen ist, liefert diese gute
Richtwerte. Da defekte Kondensatoren immer öfter auftreten, hat sich
auch die c't mit diesem Problem beschäftigt und in c't 21/03 S. 216ff
einen ausführlichen Artikel dazu veröffentlicht, der sich zu lesen
lohnt.


10.3.2 Das BIOS erscheint, aber das Betriebssystem bootet nicht
==============================================================

Zu allererst sollte man im BIOS die BIOS-Defaults laden. Hier handelt
es sich um die sicherste (und langsamste) Einstellung, die der
Hersteller vorsieht. (Später, bei erfolgreicher Lösung des Problems
sind die Setup-Defaults zu bevorzugen.)
Zusätzlich sollte man die RAM-Timings manuell auf die langsamste
Einstellung (3-3-3) setzen. Es könnte ja sein, dass der RAM falsche
Angaben über seine eigenen Leistungen macht (SPD-EEPROM falsch
programmiert) und das BIOS ihn somit zu schnell betreibt.
Eine weitere Möglichkeit bietet sich, wenn man den CPU-Multiplikator
herunter setzt, sofern möglich (bei ungelockten CPUs). Damit
untertaktet man die CPU und sollte Gewissheit haben, dass sie stabil
läuft. Alternativ setzt man den FrontSideBus herunter. Grafikkarten
sollten im AGP 1x - Modus betrieben werden, AGP Fastwrites sollte
disabled sein. Zu überprüfen ist, ob folgende Einstellungen im BIOS
getroffen wurden:

Video BIOS Shadow:          disabled
System BIOS Shadow:         disabled
Assign IRQ for VGA:         enabled

Ein ganz anderes Problem können Laufwerke machen, wenn sie an zu
langen IDE-Kablen hängen. Laut Spezifikation dürfen diese nur 47cm
lang sein, was extrem kurz für große Tower ist. Meist funktioniert
alles auch bei etwas längeren Kabeln, aber spätestens bei 80cm-Kabeln
sollte man sehr skeptisch sein.
Im Handel tauchen immer wieder spezielle runde IDE-Kabel, meist als
"AirFlow"-Kabel bezeichnet, auf. Diese versprechen eine korrekte
Funktion auch tlw. bei 90cm Kabellänge. Das wird erreicht, indem
die 40 Leitungen, die seit UDMA66 zum IDE-Kabel hinzugekommen sind
und nur Masseleitungen zur Dämpfung des Übersprechens zwischen den
Signalleitungen darstellen, entweder um die einzlnen Signalleitungen
gewickelt oder als Masse-Schirm als Netzgeflecht um die
Signalleitungen gelegt werden. Damit erhält man die
Signaleigenschaften, die denen von TwistedPair bzw. fast von
Koaxialkabel entsprechen, sodass die größere Kabellänge möglich
gemacht wird. Eine deutliche Verringerung der Gehäusetemperatur wird
allerdings oft in der Praxis nicht festgestellt und eine Garantie
für die korrekte Funktion kann auch nur der Hersteller versprechen.

10.3.3 Das Betriebssystem bootet mit Fehlern
===========================================

Hier entsteht nun ein breites Feld an möglichen Fehlerquellen. Das
beginnt mit reinen Hardwareproblemen, wie Überhitzung, defektem RAM,
geht über Inkompatibilitäten zwischen Hardwarekomponenten bis hin zu
Treiberproblemen.
Sollte das Betriebssystem auch beim Minimalsystem nur mit Fehlern
booten, so sind oft die üblichen 3 Verdächtigen zu suchen: Überhitzte
CPU, defekter RAM und zu schwaches Netzteil. Hier sollte man seine
CPU wie in 10.3.2 beschrieben untertakten und RAM bzw. Netzteil
testweise austauschen.

Seltener ist ein vorangegangener Totalcrash des Betriebssystems (was
allerdings nichts mit der Hardware zu tun hat). Windows 9x / ME sind
dafür bekannt, manchmal das Dateisystem der Festplatte nachhaltig zu
zerstören. Scandisk / Scanreg sowie das manuelle Kopieren von
möglicherweise defekten Dateien könnte helfen.

10.3.4 Das Betriebssystem konnte mit dem Minimalsystem gebootet werden
=====================================================================

Für einen schnellen Test, um zwischen CPU und RAM als Fehlerquelle
schon einmal eine Vorauswahl zu treffen, sollte man das System
gezielt untertakten. Zwei Richtlinien (nur möglich und sinnvoll z.B.
bei einer CPU mit 133MHz FSB und RAM, der ebenfalls bei 133MHz läuft
und das Motherboard 100MHZ für FSB und RAM-Takt anbietet.):

- Wenn möglich, den FSB herunter setzen, den RAM-Takt aber bei der
Normaleinstellung belassen. Verschwinden die Abstürze, so ist der
Fehler wohl eher bei der CPU (Hitze?) zu suchen.
- Wenn möglich, den RAM-Takt herunter setzen, den FSB aber bei der
Normaleinstellung belassen. Zusätzlich die RAM-Timings langsam
stellen. Verschwinden die Abstütze, so ist der Fehler wohl eher
beim RAM zu suchen.

Hat man eine instabile CPU in Verdacht (Hitze oder Fertigungsfehler),
so sollte man sie einem Streß-Test unterziehen. Das Programm Prime95
ist dafür recht gut geeignet. Spätestens nach 15 Minuten Test sollte
klar ein, ob die CPU stabil ist. Wer ganz sicher gehen will, lässt so
ein Programm eine Weile nebenher laufen, wenn er arbeitet. Dann ist
allerdings nicht gewährleistet, dass ausschliesslich die CPU Probleme
macht. Man kann so nur Abstürze provozieren und CPU und RAM in den
engeren Kreis der Verdächtigen bringen.

Den RAM kann man testen, wie in Kapitel 8.5.2 beschrieben.

Sollte bis hierhin alles stabil sein und Abstürze z.B. nur in
3D-Spielen auftreten, kann man auch meist mit der Minimalkonfiguration
die Spiele testen. Leider verlangen einige Spiele nach gewissen Dingen,
wie einer Soundkarte. Hier sollte man ggf. auf andere Testspiele
zurückgreifen.

10.3.5 Das Betriebssystem konnte normal gebootet werden
======================================================

Sinnvoll ist hier eine Abrüstung auf das Minimalsystem und
schrittweise Aufrüstung - wie in 10.2.2 beschrieben. Danach sollte
ein umfangreicher Test laufen, um den Fehler zu beobachten und zu
provozieren. Des weitern sind neue Treiber für wirklich jede
Komponente zu empfehlen. Manchmal ist der Störenfired eben eine
Komponente, die eigntlich gar nichts mit dem offensichtlichen
Problem zu tun haben scheint. Unter Windows ist ein aktuellen
DirectX ebenso wichtig.

10.3.6 Checkliste
================

Die folgende Checkliste soll Ansatzpunkte geben, um Fehler weiter
einzugrenzen und grobe Fehlkonfigurationen auszuschließen.

Software:
Die folgenden Hinweise gelten insbesondere für Windows-User.

* Chipsatztreiber für das Motherboard installieren
* aktuelle Treiber für alle Hardwarekomponenten, insbesondere für die
Grafikkarte installieren
* aktuelles DirectX verwenden
* aktuelle BIOS-Versionen verwenden, insbesondere für das Motherboard


Hardware:
* Wenn der Rechner überhaupt nicht startet: AGP-Grafikkarten müssen
tief und fest im Slot sitzen. Ruhig sinnvoll dosierte Gewalt
anwenden.
* Netzteil gemäß Spezifikation in 10.2.1 einsetzen.
* Kontrollieren, ob der ATX-Power-Stecker fest auf dem Motherboard
sitzt. Er darf im Betrieb nicht warm werden.
* System nicht übertakten, RAM-Timings automatisch einstellen lassen
oder manuell auf die langsamsten Timings einstellen.
* Hitze im Rechner überprüfen, testweise das Gehäuse öffnen (auch RAM
kann überhtitzen).
* Funktion aller Lüfter überprüfen.
* Korrekten Sitz des Kühlkörpers auf der CPU (wenig Wärmeleitpaste)
sicherstellen.
* IDE-Laufwerke an normgerechten IDE-Kabeln betreiben und einzelne
Laufwerke am Ende des Kabel anstöpseln.
* PC von Dreck säubern, dabei eventuell Steckkarten, RAM, CPU
herausziehen und Laufwerke abziehen und die Slots / Stecker säubern.
* CPU in den Sockel mit ganz leichtem Druck einsetzen, sodass sie
tief in den Sockel rutscht.
* Wenn mit dem Minimalsystem keine Probleme auftreten, dann
PCI-Steckkarten in anderen PCI-Slots betreiben, um IRQ-Sharing
zu vermeiden.
* Motherboard und Netzteil (Vorsicht - gefährliche Spannung und
Garantieverlust beim Öffnen!) untersuchen, ob Kondensatoren
beschädigt sind (Kapitel 10.3.1.6).


10.3.7 Fazit
===========

Da jetzt mehr und mehr Softwareprobleme die Ursache sein können,
sollte FAQ an dieser Stelle nicht weiter ins Detail gehen. Es kann
nur ein sinnvolles und überlegtes Vorgehen bei der Fehlersuche
empfohlen werden. Der Fehler sollte genau beobachtet werden, um
sinnvolle Rückschlüsse ziehen zu können. Auch wenn man dann durch
Kombination von verschiedenen Beobachtungen nahezu einige Dinge
ausschliessen kann, so sollte man sie nie ganz aus dem Gedächtnis
entfernen. Manchmal hat schon eine defekte Maus einen Rechner ständig
und nicht reproduzierbar zum Abstürzen gebracht.


[ Auf dieses Posting antworten ]