[03:36] istaz (~olivier@123.206-241-81.adsl-dyn.isp.belgacom.be) joined #fai. [03:44] istaz_ (~olivier@179.240-242-81.adsl-dyn.isp.belgacom.be) left irc: Ping timeout: 480 seconds [04:01] istaz_ (~olivier@182.19-241-81.adsl-dyn.isp.belgacom.be) joined #fai. [04:08] istaz (~olivier@123.206-241-81.adsl-dyn.isp.belgacom.be) left irc: Ping timeout: 480 seconds [07:52] siggg (~jean@tra78-5-88-172-128-32.fbx.proxad.net) joined #fai. [07:54] ErKa (keryell@keryell.pck.nerim.net) joined #fai. [08:15] siggg (~jean@tra78-5-88-172-128-32.fbx.proxad.net) left irc: Ping timeout: 480 seconds [08:16] ErKa (keryell@keryell.pck.nerim.net) left irc: Ping timeout: 480 seconds [09:36] i try to figure out why an installation/server is soooooo very slow. [09:36] it takes long breaks every now and then, then works with normal speed for a second and then pauses again for minutes [09:37] if i do top or iostat then the box seems totally idle. [09:37] no big iowait , no cpu, nothing, really [09:38] i see the processes (aptitude and dpkg) [09:38] where dpkg is a zombie [09:39] and i see this: 6172 tty1 S+ 0:00 sleep 1 [09:39] 6172 tty1 S+ 0:00 sleep 1 [09:55] stockholm: strace it... [09:55] maybe you end up with a misconfigured name server [09:56] this phenomen only manifests on a few (of a lot of identical) servers [09:57] oz_: but yes, i need to strace it [09:57] somehow... [09:57] bruteforce strace seems pointless as so much goes on [09:59] stockholm: grep open alone helps often [09:59] and grep -i poll [10:00] I like strace output, the more, the better [10:00] you can use it to impress custumers, too ;) [10:02] lol [10:02] so you strace to a file? [10:03] where would you start? [10:03] costomers, even [10:03] yes, those too! :-) [10:03] fsck... customers. *hrmf* [10:03] :) [10:04] stockholm: strace -o /tmp/bla -f -p [10:04] grab the entire install process...so you'll miss nada [10:04] it starts to stutter quite early... [10:05] even in the initrd i think [10:05] geee.... [10:05] does it do dns stuff in initrd? [10:05] now it got into fai... [10:05] network relies on dns... [10:06] but depends...that DNS just was an example I stumbled over this week [10:06] we had a server, which was running...but sloooooooow [10:06] I straced it, and we saw that it asked for a dns behind their firewall [10:07] i could have used tcpdump too, though... [10:07] but that produces even more output :) [10:07] righ.. [10:11] holzhammermethode [10:11] kriege ich vielleicht auch noch timestamps in syslog?? [10:12] -r [10:13] oz_: wie kann ich das denn möglicherweise in meinen config space reinhängen? [10:13] so dass er möglichst früh anfängt zu sysloggen? [10:13] eartoast: ? [10:13] eartoast: ^ [10:14] strace doch erstmal einfach das was grad läuft.... [10:14] ich glube soviel aufwand brauchts gar net [10:14] einfach schauen, was er macht, wenn er 'nichts' macht [10:15] meist pollt es da doof rum wegen $irgendwas [10:39] <_spq> ro nfs? [11:51] ro? [11:51] ich glaube nicht [11:51] <_spq> read only... [11:52] ja, i got it [11:52] <_spq> ansonsten kann es natürluich sein das server A irgendwas macht das server B warten lässt log fiels oder so [11:52] <_spq> lock [11:52] <_spq> nicht log [11:58] wildes raten verschwendet viel zeit... [11:58] was sagen denn die logs? [12:04] ich muss mit timestamp das ganze nochmal machen, ohne sieht man im log die pausen garnicht. [12:04] ich war einkaufen währenddessen [12:20] -r zeigt wie lange ein syscall gebraucht hat. [12:20] das ist genau das richtige [12:20] dann kann ich mit sort -k 2 -n (hoffentlich) einfach den übeltäter finden (wenn das hier mal bald fertig ist) [12:24] ???? [12:39] ja, ich habe jetzt eine liste mit den langsamen syscalls.... ich lade sie mal irgendwo hoch weil ich nämlich kein gutes muster sehe [12:48] ErKa (keryell@keryell.pck.nerim.net) joined #fai. [12:50] http://www.schuldei.org/slow [12:50] uname ist langsam [12:50] (wenn ich uname auf der kommandozeile ausführe ist es ganz normal schnell) [12:51] stockholm: der straceoutput wäre interessant [12:51] oz_: den habe ich auch. [12:51] moment [12:52] was sagt denn hdparm? [12:56] hm. I need FAI artwork [12:56] :=) [12:59] das ist ein raid in der kiste [12:59] und ich versuche gerade das file auf einen gut verbunden rechner im selben cluster hochzuladen... [13:08] oz_: www.schuldei.org/bla.gz [13:08] mann mann, das war schwer [13:09] da hat mich das ssh connection multiplexing in die pfanne gehauen. [13:59] hm. [13:59] COLOR_FAI_LOGO=0, nevertheless I see the ugly thing [13:59] Action: oz_ feels annoyed a bit [14:00] stockholm: ssh multiplexing? [14:01] oz_: i use ssh connection multiplexing so that secondary connections to the same server are established quicker [14:02] aber jetzt wollte ich auch noch ssh -A (also ssh agent forwarding) benutzen um sachen auf den dritten server zu kopieren [14:02] aber das ging erst als ich alle connections zum ersten server geschlossen hatte und mit -A wieder aufgebaut hatte [14:03] oz_: hast du eine idee woran die langen pausen hängen können? [14:03] uname ist ja ein verdächtiger [14:04] hab noch nicht geschaut, ne [14:05] hui, is echt ne menge stoff [14:05] 24M komprimiert [14:06] Action: oz_ macht immer noch mit usplash in der nfsroot rum [14:06] usplash bricht immer wieder ab [14:26] kann ich irgendwie den top level fai prozess time'en? [14:26] dann kann ich sehen wieviel zeit im kernel userspace etc vergeht [15:16] stockholm: oje, da meldet nscd viel... [15:16] 0.000025 poll([{fd=3, events=POLLIN, revents=POLLIN}], 1, 5000) = [15:17] stockholm: war es das ssh problem, oder wie? [15:19] nee, ssh habe ich garnicht mitgetraced [15:19] nscd sollte da nicht laufen. [15:22] hast du es schon gefixed? [15:45] allee (~ach@dialin-212-144-131-013.pools.arcor-ip.net) joined #fai. [15:49] alleeHol (~ach@dialin-212-144-130-033.pools.arcor-ip.net) joined #fai. [15:49] allee (~ach@dialin-212-144-131-013.pools.arcor-ip.net) left irc: Read error: Connection reset by peer [15:51] siggg (~jean@tra78-5-88-172-128-32.fbx.proxad.net) joined #fai. [17:52] alleeHol (~ach@dialin-212-144-130-033.pools.arcor-ip.net) left irc: Read error: Connection reset by peer [17:59] alleeHol (~ach@dialin-212-144-131-236.pools.arcor-ip.net) joined #fai. [18:20] alleeHol (~ach@dialin-212-144-131-236.pools.arcor-ip.net) left irc: Ping timeout: 480 seconds [18:48] oz_: ja, sicher, längst. :-) [18:48] das file liegt hier: [18:48] http://www.schuldei.org/bla.gz [18:51] stockholm: dann is ja gut ;) [18:58] Action: stockholm ist gespannt was du sagst... [18:59] ich wollte noch versuchen das mit einer cpu/core zu installieren. [19:02] Action: oz_ hat immer noch keinen splash-screen install [19:06] ich will mir nochmal ein besseres login bild als das DEBIAN teil basteln [19:09] mit splash säh es super-sauber aus... [19:10] ja [19:14] aber irgendwie...bekomm ich keine rechte idee wie ich das in fai einbau mit dem usplash progress [19:36] hm. das wird echt voll das ubuntu re-engineering... [19:36] oder gibt's da ein HowTo für? [19:37] hast du mal mein strace angeschaut? [19:54] alleeHol (~ach@dialin-212-144-130-033.pools.arcor-ip.net) joined #fai. [20:20] alleeHol (~ach@dialin-212-144-130-033.pools.arcor-ip.net) left irc: Ping timeout: 480 seconds [22:53] fai-guy (~fai-guy@p4FC21291.dip0.t-ipconnect.de) joined #fai. [22:54] q [22:54] fai-guy (~fai-guy@p4FC21291.dip0.t-ipconnect.de) left irc: [00:00] --- Sun Sep 14 2008