瀏覽代碼

add chapter about C timestructs of the operating system

Michael Mächtel 8 年之前
父節點
當前提交
6a8beee4b9
共有 1 個文件被更改,包括 217 次插入0 次删除
  1. 217
    0
      hw4/task2/README.md

+ 217
- 0
hw4/task2/README.md 查看文件

@@ -4,6 +4,223 @@ Some hints, to solve this task with Rust:
4 4
 
5 5
 - Have a look into the [std::mem] module.
6 6
 - Timings with the external crate [time][] is more constructive than the methods in the standard library.
7
+- As Rust uses the time keeping of the operating system, it might be interesting, if you "scan" reading through the following chapter to get an idea, whats going on beyond the Rust API.
7 8
 
8 9
 [time]: https://docs.rs/time
9 10
 [std::mem]: https://doc.rust-lang.org/std/mem/
11
+
12
+
13
+## Zeiten lesen in C
14
+
15
+### Datenstrukturen
16
+
17
+Betriebssysteme stellen Anwendungen Zeitgeber mit unterschiedlichen Eigenschaften zur Verfügung, über die das Zeitverhalten kontrolliert wird. Diese sind gekennzeichnet durch ihre
18
+* Genauigkeit,
19
+* die Zuverlässigkeit,
20
+* den Bezugspunkt,
21
+* die Darstellung und
22
+* den maximalen Zeitbereich.
23
+
24
+Das Betriebssystem repräsentiert Zeiten unter anderem mit den folgenden Datentypen (Darstellung):
25
+
26
+* clock_t: Timerticks.
27
+* struct timeval: Zeit in Mikrosekunden-Auflösung.
28
+* struct timespec: Zeit in Nanosekunden-Auflösung.
29
+* struct tm: absolute Zeitangabe.
30
+
31
+```c
32
+struct timeval {
33
+
34
+    time_t      tv_sec;     /* seconds */
35
+    suseconds_t tv_usec;    /* microseconds */
36
+};
37
+
38
+struct timespec {
39
+    time_t tv_sec; /* seconds */
40
+    long tv_nsec; /* nanoseconds */
41
+};
42
+
43
+struct tm
44
+{
45
+    int tm_sec; /* seconds */
46
+    int tm_min; /* minutes */
47
+    int tm_hour; /* hours */
48
+    int tm_mday; /* day of the month */
49
+    int tm_mon; /* month */
50
+    int tm_year; /* year */
51
+    int tm_wday; /* day of the week */
52
+    int tm_yday; /* day in the year */
53
+    int tm_isdst; /* daylight saving time */
54
+};
55
+```
56
+
57
+Die Strukturen struct timeval und struct timespec bestehen aus jeweils zwei Variablen, die einmal den Sekundenanteil und einmal den Mikro- beziehungsweise den Nanosekundenanteil repräsentieren. Die Darstellung erfolgt jeweils normiert. Das bedeutet, dass der Mikro- oder Nanosekundenanteil immer kleiner als eine volle Sekunde bleibt. Ein Zeitstempel von beispielsweise 1 Sekunde, 123456 Mikrosekunden ist gültig, 1 Sekunde, 1234567 Mikrosekunden ist ungültig. In normierter Darstellung ergäbe sich 2 Sekunden, 234567 Mikrosekunden.
58
+
59
+Die Darstellungs- beziehungsweise Repräsentationsform reflektiert auch den darstellbaren Wertebereich. Da bei den dargestellten Datenstrukturen für den Typ time\_t ein long eingesetzt wird, lassen sich auf einer 32-Bit Maschine rund 4 Milliarden Sekunden zählen, auf einer 64-Bit Maschine 2\^64 (mehr als 500 Milliarden Jahre).
60
+
61
+Als Bezugspunkte haben sich die folgenden eingebürgert: *Start des Systems, *Start eines Jobs und \*Start einer Epoche, beispielsweise "Christi Geburt" oder der 1.1.1970 (Unix-Epoche). Dieser Bezugspunkt weist zudem noch eine örtliche Komponente auf: Der Zeitpunkt 19:00 Uhr in Europa entspricht beispielsweise einem anderen Zeitpunkt in den USA (minus sechs Stunden zur Ostküste).
62
+
63
+Die Genauigkeit wird beeinflußt durch, die Taktung des Zeitgebers, deren Schwankungen und durch Zeitsprünge.
64
+
65
+Das Attribut Zuverlässigkeit eines Zeitgebers beschreibt dessen Verhalten bei (bewußten) Schwankungen der Taktung und bei Zeitsprüngen: Ein Zeitgeber kann beispielsweise der Systemuhr folgen (CLOCK\_REALTIME) oder unabhängig von jeglicher Modifikation an der Systemzeit einfach weiterzählen (CLOCK\_MONOTONIC). Die Posix-Realzeiterweiterung beziehungsweise Linux-Systeme definieren hierzu folgende Clocks [Man-Page zu clock\_gettime()](http://linux.die.net/man/3/clock_gettime):
66
+* **CLOCK\_REALTIME**: Dieser Zeitgeber repräsentiert die systemweite, aktuelle Zeit. Er reagiert auf Zeitsprünge, sowohl vorwärts als auch rückwärts, die beispielsweise beim Aufwachen (Resume) nach einem Suspend (Schlafzustand des gesamten Systems) ausgelöst werden. Er reagiert ebenfalls auf unterschiedliche Taktungen, die beispielsweise durch NTP erfolgen. Dieser Zeitgeber liefert die Sekunden und Nanosekunden seit dem 1.1. 1970 UTC (Unixzeit) zurück.
67
+* **CLOCK\_MONOTONIC**: Dieser Zeitgeber läuft entsprechend seiner Auflösung stets vorwärts, ohne dabei Zeitsprünge zu vollziehen. Er ist also unabhängig von der mit Superuserprivilegien zu verändernden Systemuhr. Allerdings reagiert dieser Zeitgeber auf Modifikationen der Taktung, die beispielsweise durch NTP erfolgen.
68
+* **CLOCK\_MONOTONIC_RAW**: Dieser Zeitgeber ist linuxspezifisch. Er reagiert weder auf Zeitsprünge noch auf in Betrieb geänderte Taktungen (NTP).
69
+* **CLOCK\_PROCESS\_CPUTIME_ID**: Dieser Zeitgeber erfasst die Verarbeitungszeit (Execution Time) des zugehörigen Prozesses. Das funktioniert aber nur zuverlässig auf Single-Core-Systemen beziehungsweise wenn sichergestellt werden kann, dass keine Prozessmigration stattfindet.
70
+* **CLOCK\_THREAD\_CPUTIME\_ID**: Dieser Zeitgeber erfasst die Verarbeitungszeit (Execution Time) des zugehörigen Threads. Das funktioniert aber nur zuverlässig auf Single-Core-Systemen beziehungsweise wenn sichergestellt werden kann, dass keine Prozessmigration stattfindet.
71
+
72
+Der maximale Zeitbereich schließlich ergibt sich durch die Auflösung des Zeitgebers und die Bitbreite der Variablen:
73
+
74
+```
75
+zeitbereich = auflösung * 2^bitbreite
76
+```
77
+
78
+#### Zeit lesen
79
+
80
+Es gibt unterschiedliche Systemfunktionen, mit denen die aktuelle Zeit gelesen werden kann. Favorisiert ist die Funktion *int clock\_gettime(clockid\_t clk\_id, struct timespec * tp)*, die die Zeit seit dem 1.1.1970 (Unixzeit) als Universal Time (Zeitzone UTC) zurückliefert (struct timespec). Konnte die aktuelle Zeit gelesen werden, gibt die Funktion Null, ansonsten einen Fehlercode zurück. Allerdings ist das Auslesen auf 32-Bit Systemen in so fern problematisch, da der 32-Bit Zähler am 19. Januar 2038 überläuft.
81
+
82
+```c
83
+struct timespec {
84
+        time_t   tv_sec;        /* seconds */
85
+        long     tv_nsec;       /* nanoseconds */
86
+};
87
+
88
+```
89
+
90
+```c
91
+struct timespec timestamp;
92
+    ...
93
+    if (clock_gettime(CLOCK_MONOTONIC,&timestamp))
94
+    {
95
+        perror("timestamp");
96
+        return -1;
97
+    }
98
+    printf("seconds: %ld, nanoseconds: %ld\n",
99
+        timestamp.tv\_sec, timestamp.tv\_nsec);
100
+```
101
+
102
+Durch die Wahl der Clock CLOCK\_PROCESS\_CPUTIME\_ID beziehungsweise CLOCK\_THREAD\_CPUTIME\_ID kann auch die Verarbeitungszeit ausgemessen werden (Profiling).
103
+
104
+Die Genauigkeit der zurückgelieferten Zeit kann mit Hilfe der Funktion *clock\_getres(clockid\_t clk\_id, struct timespec * res)* ausgelesen werden.
105
+
106
+Die Funktion *clock\_gettime()* ist nicht in der Standard-C-Bibliothek zu finden, sondern in der Realzeit-Bibliothek librt. Daher ist bei der Programmgenerierung diese Bibliothek hinzuzulinken (Parameter -lrt). Steht nur die Standard-C-Bibliothek zur Verfügung, kann *time\_t time(time\_t * t)* oder auch *int gettimeofday(struct timeval * tv, struct timezone * tz)* eingesetzt werden.
107
+
108
+*time()* gibt die Sekunden zurück, die seit dem 1.1.1970 (UTC) vergangen sind.
109
+
110
+```c
111
+time_t now;
112
+...
113
+now = time(NULL);
114
+```
115
+
116
+*gettimeofday()* schreibt an die per tv übergebene Speicheradresse die Sekunden und Mikrosekunden seit dem 1.1.1970. Das Argument tz wird typischerweise mit NULL angegeben.
117
+
118
+Liegen die Sekunden seit dem 1.1.1970 vor (timestamp.tv\_sec), können diese mit Hilfe der Funktionen *struct tm * localtime\_r(const time\_t * timep, struct tm * result)* oder *struct tm * gmtime\_r(const time\_t * timep, struct tm * result)* in die Struktur struct tm konvertiert werden.
119
+
120
+```c
121
+struct tm absolute_time;
122
+if (localtime_r( timestamp.tv_sec, &absolute_time )==NULL)
123
+{
124
+    perror("localtime_r" );
125
+    return -1;
126
+}
127
+
128
+printf("year: %d\n", absolute_time.tm_year);
129
+```
130
+
131
+Die Funktion *time\_t mktime(struct tm * tm)* konvertiert eine über die Struktur struct tm gegebene Zeit in Sekunden seit dem 1.1.1970 (time\_t).
132
+
133
+Mit Hilfe der Funktion *clock\_t times(struct tms \ buf)* lässt sich sowohl die aktuelle Zeit zu einem letztlich nicht genau definierten Bezugspunkt, als auch die Verarbeitungszeit (Execution-Time) des aufrufenden Prozesses bestimmen. Die Zeiten werden als Timerticks (clock\_t) zurückgeliefert. Die zurückgelieferte Verarbeitungszeit ist aufgeschlüsselt in die Anteile, die im Userland und die Anteile, die im Kernel verbraucht wurden. Außerdem werden diese Anteile auch für Kindprozesse gelistet.
134
+
135
+```c
136
+#include <stdio.h>
137
+#include <sys/times.h>
138
+#include <unistd.h>
139
+#include <time.h>
140
+
141
+int main( int argc, char **argv, char **envp )
142
+{
143
+    struct tms exec_time;
144
+    clock_t act_time;
145
+    long ticks_per_second;
146
+    long tickduration_in_ms;
147
+
148
+    ticks_per_second = sysconf(_SC_CLK_TCK);
149
+    tickduration_in_ms = 1000/ticks_per_second;
150
+
151
+    act_time = times( &exec_time );
152
+    printf("actual time (in ms): %ld\n", act_time*tickduration_in_ms);
153
+    printf("execution time (in ms): %ld\n",
154
+            (exec_time.tms_utime+exec_time.tms_stime)*tickduration_in_ms);
155
+
156
+    return 0;
157
+
158
+}
159
+```
160
+
161
+Sehr genaue Zeiten lassen sich erfassen, falls der eingesetzte Prozessor einen Zähler besitzt, der mit der Taktfrequenz des Systems getaktet wird. Bei einer x86-Architektur (PC) heißt dieser Zähler Time Stamp Counter (TSC). Der TSC kann auch von einer normalen Applikation ausgelesen werden, allerdings muss sichergestellt sein, dass sich die Taktfrequenz zwischen zwei Messungen ändert. Alternativ kann man sich vom Betriebssystem über die Taktänderung informieren lassen.
162
+
163
+#### Zeitvergleich: Differenzzeitmessung
164
+
165
+Zwei Absolutzeiten (struct tm) werden am einfachsten über deren Repräsentation in Sekunden verglichen. Die Umwandlung erfolgt über die Funktion (time\_t mktime(struct tm \*tm)). Allerdings ist dabei zu beachten, dass es auf einem 32-Bit System am 19. Januar 2038 zu einem Überlauf kommt. Wird einer der beiden Zeitstempel vor dem 19. Januar 2038 genommen, der andere danach, kommt es zu einem falschen Ergebnis, wenn nur die beiden Werte per "\<" beziehungsweise "\>" verglichen werden.
166
+
167
+Das ist ein generelles Problem und kann dann gelöst werden, wenn sichergestellt ist, dass die zu vergleichenden Zeiten nicht weiter als die Hälfte des gesamten Zeitbereiches auseinanderliegen. In diesem Fall lassen sich die Makros einsetzen, die im Linux-Kernel für den Vergleich zweier Zeiten eingesetzt werden. Das Makro time\_after(a,b) liefert true zurück, falls es sich bei a um eine spätere Zeit als b handelt. Das Makro time\_after\_eq(a,b) liefert true zurück, falls es sich bei a um eine spätere Zeit oder um die gleiche Zeit handelt, wie b handelt. Die Zeitstempel a und b müssen beide vom Typ unsigned long sein. Natürlich können die Makros auch auf andere Datentypen angepasst werden
168
+
169
+[HEADERDATEI linux/jiffies.h].
170
+
171
+```c
172
+#define time_after(a,b)         \
173
+        (typecheck(unsigned long, a) && \
174
+         typecheck(unsigned long, b) && \
175
+         ((long)(b) - (long)(a) < 0))
176
+
177
+#define time_before(a,b)        time_after(b,a)
178
+
179
+#define time_after_eq(a,b)      \
180
+        (typecheck(unsigned long, a) && \
181
+         typecheck(unsigned long, b) && \
182
+         ((long)(a) - (long)(b) \>= 0))
183
+
184
+#define time_before_eq(a,b)     time_after_eq(b,a)
185
+```
186
+
187
+Beim Benchmarking ist es häufig notwendig eine Zeitdauer zu messen, Zeitpunkte zu erfassen oder eine definierte Zeit verstreichen zu lassen. Dabei sind folgende Aspekte zu beachten:
188
+* Die Genauigkeit der eingesetzten Zeitgeber,
189
+* die maximalen Zeitdifferenzen,
190
+* Schwankungen der Zeitbasis, beispielsweise durch Schlafzustände,
191
+* Modifikationen an der Zeitbasis des eingesetzten Rechnersystems (Zeitsprünge) und
192
+* die Ortsabhängigkeit absoluter Zeitpunkte.
193
+
194
+Zur Bestimmung einer Zeitdauer verwendet man häufig eine Differenzzeitmessung. Dabei wird vor und nach der auszumessenden Aktion jeweils ein Zeitstempel genommen. Die Zeitdauer ergibt sich aus der Differenz dieser beiden Zeitstempel.
195
+
196
+Dies ist allerdings nicht immer ganz einfach. Liegt der Zeitstempel beispielsweise in Form der Datenstruktur struct timeval (als Ergebnis der Funktion *gettimeofday()*) vor, müssen die Sekunden zunächst getrennt von den Mikrosekunden subtrahiert werden. Ist der Mikrosekundenanteil negativ, muss der Sekundenanteil um eins erniedrigt und der Mikrosekundenanteil korrigiert werden. Dazu wird auf die Anzahl der Mikrosekunden pro Sekunde (also eine Million) der negative Mikrosekundenanteil addiert.
197
+
198
+```c
199
+#define MICROSECONDS\_PER\_SECOND 1000000
200
+
201
+struct timespec * diff_time( struct timeval before, struct timeval after,
202
+    struct timeval *result )
203
+{
204
+    if (result==NULL)
205
+        return NULL;
206
+
207
+    result->tv_sec = after.tv_sec - before.tv_sec;
208
+    result->tv_usec= after.tv_usec- before.tv_usec;
209
+
210
+    if (result->tv_usec<0) {
211
+        result->tv_sec--;
212
+        /* result->tv_usec is negative, therefore we use "+" */
213
+        result->tv_usec = MICROSECONDS_PER_SECOND+result->tv_usec;
214
+    }
215
+    return result;
216
+
217
+}
218
+```
219
+Für Zeitstempel vom Typ struct timeval gilt entsprechendes. Anstelle der MICROSECONDS\_PER\_SECOND sind NANOSECONDS\_PER\_SECOND einzusetzen. Sind die Zeitstempel vorzeichenlos, sieht die Rechnung für den Sekundenanteil etwas komplizierter aus. Das soll hier aber nicht weiter vertieft werden.
220
+
221
+Etwas einfacher ist die Differenzbildung, wenn aus der Datenstruktur eine einzelne Variable mit der gewünschten Auflösung, beispielsweise Mikrosekunden, generiert wird. Im Fall von struct timeval wird dazu der Sekundenanteil mit einer Million multipliziert und der Mikrosekundenanteil aufaddiert. Bei der Multiplikation können natürlich Informationen verloren gehen, allerdings geht der gleiche Informationsgehalt auch beim zweiten Zeitstempel verloren. Für die Differenzbildung ist das damit nicht relevant, solange der zu messende zeitliche Abstand kleiner als 1000 Sekunden ist und es während der Messung keinen Überlauf beim Sekundenanteil gibt.
222
+
223
+```c
224
+time_in_usec=((nachher.tv_sec*1000000)+nachher.tv_usec)-
225
+    ((vorher.tv_sec*1000000)+vorher.tv_usec);
226
+```

Loading…
取消
儲存