Packets: Adjust SENF_PARSER_VARIANT implementation for better public/private support
[senf.git] / HowTos / NewPacket / Mainpage.dox
1 // $Id$
2 //
3 // Copyright (C) 2008
4 // Fraunhofer Institute for Open Communication Systems (FOKUS)
5 // Competence Center NETwork research (NET), St. Augustin, GERMANY
6 //     Stefan Bund <g0dil@berlios.de>
7 //
8 // This program is free software; you can redistribute it and/or modify
9 // it under the terms of the GNU General Public License as published by
10 // the Free Software Foundation; either version 2 of the License, or
11 // (at your option) any later version.
12 //
13 // This program is distributed in the hope that it will be useful,
14 // but WITHOUT ANY WARRANTY; without even the implied warranty of
15 // MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
16 // GNU General Public License for more details.
17 //
18 // You should have received a copy of the GNU General Public License
19 // along with this program; if not, write to the
20 // Free Software Foundation, Inc.,
21 // 59 Temple Place - Suite 330, Boston, MA  02111-1307, USA.
22
23 /** \mainpage Defining and using a new 'libPacket' Packet Type 
24
25     This howto will introduce the facilities needed to define a new packet type. As example, the
26     \c GREPacket type is defined. 
27
28     \autotoc
29
30
31     \section howto_newpacket_overview Overview
32
33     The packet library supports two basic packet representations, the more generic one being
34     senf::Packet. This representation does not know anything about the type of packet, its fields or
35     properties. It really only is a bunch of bytes. Possibly there is a preceding packet (header) or
36     a following one, but that is all, a senf::Packet knows.
37
38     The second representation is implemented by senf::ConcretePacket. This representation derives
39     from senf::Packet and adds information about the packet type, its fields, eventually some
40     invariants or packet specific operations etc. In what follows, we will concentrate on this
41     latter representation.
42
43     A concrete packet type in senf provides a lot of detailed information about a specific type of
44     packet:
45
46     \li It provides access to the packets fields
47     \li It may provide additional packet specific functions (e.g. calculating or validating a
48         checksum)
49     \li It provides information on the nesting of packets
50     \li It implements packet invariants
51
52     To define a new packet type, we need to implement two classes which together provide all this
53     information: 
54
55     \li a \e parser (a class derived from senf::PacketParserBase). This class defines the data
56         fields of the packet header and may also provide additional packet specific functionality.
57     \li a \e packet \e type (a class derived from senf::PacketTypeBase). This class defines, how
58         packets are nested and how to initialize and maintain invariants.
59
60     The following sections describe how to define these classes. Where appropriate, we will use GRE
61     (Generic Routing Encapsulation) as an example.
62
63     \section howto_newpacket_gre Introducing the GRE example packet type
64
65     When defining a new packet type, we start out by answering two important questions:
66
67     \li What kind of parser is needed for this packet type (fixed size or variable sized).
68     \li Whether the packet has another packet as payload (a nested packet) and how the type of this
69         payload is found (whether a registry is used and if yes, which).
70
71     In the case of GRE, these questions can be answered by just looking at the GRE specification in
72     <a href="http://tools.ietf.org/html/rfc2784">RFC 2784</a>. In Section 2.1 we find the header
73     layout:
74
75     <pre>
76      0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
77     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
78     |C|       Reserved0       | Ver |         Protocol Type         |
79     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
80     |      Checksum (optional)      |       Reserved1 (Optional)    |
81     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
82     </pre>
83
84     This header is followed by the payload data.
85
86     Using this protocol definition, we see that the header incorporates optional fields. Therefore
87     it must be dynamically sized: if the \a Checksum \a Present bit \a C is set, both \a Checksum
88     and \a Reserved1 are present, otherwise both must be omitted.
89
90     Further inspection of the RFC reveals that the \a Protocol \a Type is used to define the type of
91     payload which directly follows the GRE header. This value is an <a
92     href="http://www.iana.org/assignments/ethernet-numbers">ETHERTYPE</a> value. To allow the packet
93     library to automatically parse the GRE payload data, we need to tell the packet library which
94     ETHERTYPE is implemented by which packet type. This kind of association already exists in the
95     form of the senf::EtherTypes registry. Our GRE packet will therefore use this registry.
96
97     To summarize:
98
99     \li The GRE packet header is a dynamically sized header.
100     \li The GRE packet header uses the senf::EtherTypes registry for next-header selection.
101
102
103     \section howto_newpacket_parser Implementing the packet parser
104
105     Each parser is responsible for turning a bunch of bytes into an interpreted header with specific
106     fields. A parser instance is initialized with an iterator (pointer) to the first byte to be
107     interpreted (the first byte of the packet data) and provides member functions to access the
108     header fields. You could implement these members manually, but the SENF library provides a large
109     set of helper macros which simplify this task considerably.
110
111     \subsection howto_newpacket_parser_skeleton The PacketParser skeleton
112
113     \code
114     #include <senf/Packets.hh>
115
116     struct GREPacketParser : public senf::PacketParserBase
117     {
118     #   include SENF_PARSER()
119
120         // Define fields
121         // (see below)
122
123         SENF_PARSER_FINALIZE(GREPacketParser);
124     };
125     \endcode
126
127     This is the standard skeleton of any parser class: We need to inherit senf::PacketParserBase and
128     start out by including either \ref SENF_PARSER() or \ref SENF_FIXED_PARSER(), depending on
129     whether we define a fixed size or a dynamically sized parser. As \c GREPacketParser is
130     dynamically sized, we include \ref SENF_PARSER().
131
132     The definition of fields will be described in the next subsection.
133
134     After the fields have been defined, we need to call the \ref SENF_PARSER_FINALIZE() macro to
135     close of the parser definition. This call takes the name of the parser being defined as it's
136     sole argument.
137
138     This is already a valid parser, albeit not a very usable one, since it does not define any
139     fields. We now go back to define the parser fields and begin with the simple part: fields which
140     are always present.
141
142     \subsection howto_newpacket_parser_simple Simple field definitions
143
144     Packet parser fields are defined using special \ref packetparsermacros. We take the fields
145     directly from the packet definition (the GRE RFC in this case). This will give us to the
146     following code fragment:
147
148     \code
149     SENF_PARSER_BITFIELD  ( checksumPresent, 1, bool     );
150     SENF_PARSER_SKIP_BITS (                 12           );
151     SENF_PARSER_BITFIELD  ( version,         3, unsigned );
152     SENF_PARSER_BITFIELD  ( protocolType,   16, unsigned );
153     \endcode
154     
155     This is a correct \c GREPacket header definition, but there is room for a small optimization:
156     Since the \a protocolType field is exactly 2 bytes wide and is aligned on a byte boundary, we
157     can define it as a UInt16 field (instead of a bitfield):
158     
159     \code
160     SENF_PARSER_BITFIELD  ( checksumPresent,  1, bool     );
161     SENF_PARSER_SKIP_BITS (                  12           );
162     SENF_PARSER_BITFIELD  ( version,          3, unsigned );
163     SENF_PARSER_FIELD     ( protocolType,    senf::UInt16Parser );
164     \endcode
165
166     Whereas \ref SENF_PARSER_BITFIELD can only define bit-fields, \ref SENF_PARSER_FIELD can define
167     almost arbitrary field types. The type is specified by passing the name of another parser to
168     \ref SENF_PARSER_FIELD.
169
170     It is important to understand, that the accessors do \e not return the parsed field value.
171     Instead, they return another \e parser which is used to further interpret the value. This is due
172     to the inherently recursive nature of the SENF packet parsers, that allows us to define rather
173     complex header formats if needed. Of course, at some point we will hit bottom and need real
174     values. This is, what <em>value parsers</em> do: they interpret some bytes or bits and return
175     the value of that field (not a parser). Examples are the bitfield parsers returned by the
176     accessors generated by SENF_PARSER_BITFIELD (like senf::UIntFieldParser) or the
177     senf::UInt16Parser.
178
179     What is going on inside the macros above? Basically, they define accessor functions for a
180     specific field, like \a checksumPresent() or \a protocolType(). They also manage a <em>current
181     Offset</em>. This value is advanced according to the field size whenever a new field is defined
182     (and since this parser is defined as a dynamically sized parser, this offset is not constant but
183     an expression which calculates the offset of a field depending on the preceding data).
184
185     \subsection howto_newpacket_parser_variant Defining optional fields: The 'variant' parser
186
187     The parser is currently very simple, and it could have been defined as a fixed size parser. Now
188     for the tricky part: defining parsers the optional fields. The mechanism described here is
189     suitable for a single optional field as well as for an optional contiguous sequence of fields.
190
191     In our GRE example, there are two fields which need to be enabled/disabled en bloc. We first
192     define an auxiliary sub-parser which combines the two fields.    
193
194     \code
195     struct GREPacketParser_OptFields : public senf::PacketParserBase
196     {
197     #   include SENF_FIXED_PARSER()
198         
199         // typedef checksum_t uint16_t; XXX defined automatically???
200
201         SENF_PARSER_FIELD ( checksum, senf::UInt16Parser );
202         SENF_PARSER_SKIP  (           2                  );
203
204         SENF_PARSER_FINALIZE(GREPacketParser_OptFields);
205     };
206     \endcode
207
208     This parser only parses the two optional fields, the second ("Reserved1") field just being
209     skipped. It is a fixed size parser, as indicated by the SENF_FIXED_PARSER() macro. We can
210     now use \ref SENF_PARSER_VARIANT() to add it as an optional parser to the GRE header in our \c
211     GREPacketParser implementation (the typedef'ed checksum_t will be used later on):
212
213     \code
214     SENF_PARSER_BITFIELD  ( checksumPresent,  1, bool     );
215     SENF_PARSER_SKIP_BITS (                  12           );
216     SENF_PARSER_BITFIELD  ( version,          3, unsigned );
217
218     SENF_PARSER_FIELD     ( protocolType,    senf::UInt16Parser );
219
220     SENF_PARSER_VARIANT   ( optionalFields,  checksumPresent,
221                                              (senf::VoidPacketParser)
222                                              (GREPacketParser_OptFields) );
223     \endcode
224
225     For a variant parser, two things need to be specified: a selector and a list of variant parsers.
226     The selector is a distinct parser field that is used to decide which variant to choose. In this
227     simple case, the field must be an unsigned integer (more precisely: a value parser returning a
228     value which is implicitly convertible to \c unsigned). This value is used as an index into the
229     list of variant types. So in our case, the value 0 (zero) is associated with
230     senf::VoidPacketParser, whereas the value 1 (one) is associated with \c
231     GREPacketParser_OptFields. senf::VoidPacketParser is a special (empty or no-op) parser which is
232     used in a variant to denote a case in which the variant parser should not parse anything.
233
234     This parser will work, it is however not very safe and not very usable. If \a p is a
235     GREPacketParser instance, than we would access the fields via:
236     \code
237     p.checksumPresent()                    = true;
238     p.version()                            = 4u;
239     p.protocolType()                       = 0x86dd;
240     p.optionalFields().get<1>().checksum() = 12345u;
241     \endcode
242     
243     This code has two problems:
244     \li accessing the checksum field is quite unwieldy
245     \li changing the checksumPresent() value will break the parser
246
247     The second problem is caused by the fact that the variant parser needs to be informed whenever
248     the selector (here \a checksumPresent) is changed, since the variant parser must ensure that the
249     header data stays consistent. Whenever the checksumPresent field is enabled, the variant parser
250     needs to insert additional 4 bytes of data. And it must remove those bytes whenever the
251     checksumPresent field is disabled. 
252
253     \subsection howto_newpacket_parser_fixvariant Fixing access by providing custom accessor members
254
255     The problems outlined above will happen whenever we use variant parsers, and they will often
256     occur with other complex parsers too (most XXX \ref parsercollection reference some field
257     external to themselves, and they will break if that value is changed without them knowing about
258     it). There might be other reasons to restrict access to a field: the field may be set
259     automatically or it may be calculated from other values (we'll see later how to do this).
260
261     In all these cases we will want to disallow the user to directly change the value, while still
262     allowing to read the value. To do this, we can mark \e value \e fields as read-only:
263
264     \code
265     SENF_PARSER_BITFIELD_RO ( checksumPresent,  1, bool     );
266     \endcode
267
268     \e Value \e fields are fields implemented by parsers returning a simple value (i.e. bit-field,
269     integer and some additional parsers like those parsing network addresses) as apposed to complex
270     sub-parsers.
271
272     In this case however, we still want to allow the user to change the field value, albeit not
273     directly. We will need to go through the collection parser, in this case the variant. 
274
275     The syntax for accessing a variant is quite cumbersome. Therefore we adjust the variant
276     definition to generate a more usable interface:
277
278     \code
279     SENF_PARSER_PRIVATE_VARIANT ( optionalFields_, checksumPresent,
280                                       (novalue(disable_checksum, senf::VoidPacketParser))
281                                       (     id(checksum,         GREPacketParser_OptFields)) );
282     \endcode
283
284     Here, we changed to things:
285     \li We made the variant private
286     \li We added some optional information to the variants type list
287
288     With this information, \ref SENF_PARSER_PRIVATE_VARIANT() will create some additional \e public
289     accessor members (those are public, only the variant itself is private). The members generated
290     work like:
291     \code
292     void disable_checksum() const { optionalFields_().init<0>; }
293
294     typedef GREPacketParser_OptFields checksum_t;
295     checksum_t checksum()      const { return optionalFields_().get<1>(); }
296     void       init_checksum() const { optionalFields_().init<1>; }
297     bool       has_checksum()  const { return optionalFields_().variant() == 1; }
298     \endcode
299     (Again: We don't implement these fields ourselves, this is done by \ref SENF_PARSER_VARIANT())
300
301     \c disable_checksum() and \c init_checksum() change the selected variant. This will
302     automatically change the \c checksumPresent() field accordingly.
303
304     The \c GREPacketParser is now simple and safe to use. The only responsibility of the user now is to
305     only access \a checksum() if the \a checksumPresent() field is set. Otherwise, the behavior is
306     undefined (in debug builds, the parser will terminate the application with an assert).
307
308     
309     \subsection howto_newpacket_parser_add Providing additional functionality
310
311     We have now implemented parsing all the header fields. However, often packets would benefit from
312     additional functionality. In the case of GRE, this could be a function to calculate the checksum
313     value if it is enabled. Defining this member will also show, how to safely access the raw packet
314     data from a parser member.
315
316     \code
317     #include <senf/Utils/IpChecksum.hh>
318
319     checksum_t::checksum_t::value_type calculateChecksum() const 
320     {
321         if (!checksumEnabled()) 
322             return 0;
323
324         senf::IpChecksum cs;
325         cs.feed( i(), i(4) );
326         // Skip even number of 0 bytes (the 2 bytes checksum field)
327         // cs.feed(0); cs.feed(0);
328         cs.feed( i(6), data().end() );
329
330         return cs.sum()
331     }
332     \endcode
333
334     This code just implements what is defined in the RFC: The checksum covers the complete GRE
335     packet including it's header with the checksum field temporarily set to 0. Instead of really
336     changing the checksum field we manually pass the correct data to \a cs. 
337
338     We use the special <tt>i(</tt><i>offset</i><tt>)</tt> helper to get iterators \a offset number
339     of bytes into the data. This helper has the additional benefit of range-checking the returned
340     iterator and is thereby safe from errors due to truncated packets: If the offset is out of
341     range, a TruncatedPacketException will be thrown.
342
343     The \a data() function on the other hand returns a reference to the complete data container of
344     the packet under inspection (the GRE packet in this case). Access to \a data() should be
345     restricted as much as possible. It is safe when defining new packet parsers (parsers, which
346     parser a complete packet like GREPacketParser). It's usage from sub parsers (like
347     GREPacketParser_OptFields or even senf::UInt16Parser) would be much more arcane and should be
348     avoided.
349
350
351     \subsection howto_newpacket_parser_final The complete GREPacketParser implementation
352
353     So this is now the complete implementation of the \c GREPacketParser:
354
355     \code
356     #include <senf/Packets.hh>
357     
358     struct GREPacketParser_OptFields : public senf::PacketParserBase
359     {
360     #   include SENF_FIXED_PARSER()
361
362         SENF_PARSER_FIELD           ( checksum,        senf::UInt16Parser            );
363         SENF_PARSER_SKIP            (                   2                            );
364
365         SENF_PARSER_FINALIZE(GREPacketParser_OptFields);
366     };
367
368     struct GREPacketParser : public senf::PacketParserBase
369     {
370     #   include SENF_PARSER()
371
372         SENF_PARSER_BITFIELD_RO     ( checksumPresent,  1, bool                      );
373         SENF_PARSER_SKIP_BITS       (                  12                            );
374         SENF_PARSER_BITFIELD        ( version,          3, unsigned                  );
375
376         SENF_PARSER_FIELD           ( protocolType,    senf::UInt16Parser            );
377
378         SENF_PARSER_PRIVATE_VARIANT ( optionalFields_, checksumPresent,
379                                           (novalue(disable_checksum, senf::VoidPacketParser))
380                                           (     id(checksum,         GREPacketParser_OptFields)) );
381
382         SENF_PARSER_FINALIZE(GREPacketParser);
383
384         checksum_t::checksum_t::value_type calculateChecksum() const;
385     };
386
387     // In the implementation (.cc) file:
388
389     #include <senf/Utils/IpChecksum.hh>
390     
391     GREPacketParser::checksum_t::value_type GREPacketParser::calculateChecksum() const
392     {
393         if (!checksumEnabled()) 
394             return 0;
395
396         validate(6);
397         senf::IpChecksum cs;
398         cs.feed( i(), i()+4 );
399         // Skip even number of 0 bytes (the 2 bytes checksum field)
400         // cs.feed(0); cs.feed(0);
401         cs.feed( i()+6, data().end() );
402
403         return cs.sum()
404     }
405     \endcode
406
407
408     \section howto_newpacket_type Defining the packet type
409
410     After defining the packet parser, the <em>packet type</em> must be defined. This class is used
411     as a policy and collects all the information necessary to be known about the packet type.
412
413     The <em>packet type</em> class is \e never instantiated. It has only typedef, constants or
414     static members.
415
416     \subsection howto_newpacket_type_skeleton The packet type skeleton
417
418     For every type of packet, the <em>packet type</em> class will look roughly the same. If the
419     packet uses a registry and is not hopelessly complex, the packet type will almost always
420     look like this:
421
422     \code
423     #include <senf/Packets.hh>
424
425     struct GREPacketType
426         : public senf::PacketTypeBase,
427           public senf::PacketTypeMixin<GREPacketType, EtherTypes>
428     {
429         typedef senf::PacketTypeMixin<GREPacketType, EtherTypes> mixin;
430         typedef senf::ConcretePacket<GREPacketType> packet;
431         typedef senf::GREPacketParser parser;
432     
433         using mixin::nextPacketRange;
434         using mixin::nextPacketType;
435         using mixin::init;
436         using mixin::initSize;
437
438         // Define members here
439     };
440     \endcode
441
442     We note, that it derives from two classes: senf::PacketTypeBase and
443     senf::PacketTypeMixin. senf::PacketTypeBase must be inherited by every packet type class. the
444     senf::PacketTypeMixin provides default implementations for some members which are useful for
445     most kinds of packets. If a packet type is very complex and these defaults don't work, the mixin
446     class can and should be left out. More on this (what the default members do exactly and when the
447     mixin can be used) can be found in the senf::PacketTypeMixin documentation.
448
449     Of the typedefs, only \a parser is mandatory. It defines the packet parser to use to interpret
450     this type of packet. \a mixin and \a packet are defined to simplify the following
451     definitions (More on \a packet and senf::ConcretePacket later).
452
453     The next block of statements imports all the default implementations provided by the mixin
454     class:
455     
456     \li \a nextPacketRange provides information about where the next packet lives within the GRE
457         packet.
458     \li \a nextPacketType provides the type of the next packet from information in the GRE packet.
459     \li \a init is called to initialize a new GRE packet. This call is forwarded to \c
460         GREPacketParser::init.
461     \li \a initSize is called to find the size of an empty (newly create) GRE packet. This is also
462         provided by GREPacketParser.
463     
464     With these default implementations provided by the mixin, only a few additional members are
465     needed to complete the \c GREPacketType: \a nextPacketKey, \a finalize, and \a dump.
466
467
468     \subsection howto_newpacket_type_registry Utilizing the packet registry
469
470     A packet registry maps an arbitrary key value to a type of packet represented by a packet
471     factory instance. There may be any number of packet registries. When working with packet
472     registries, there are three separate steps:
473     \li Using the registry to tell the packet library, what type of packet to instantiate for the
474         payload.
475     \li Given a payload packet of some type, set the appropriate payload type field in the packet
476         header to the correct value (inverse of above).
477     \li Adding packets to the registry.
478
479     We want the GRE packet to utilize the senf::EtherTypes registry to find the type of packet
480     contained in the GRE payload.  The details have already been taken care of by the
481     senf::PacketTypeMixin (it provides the \a nextPacketType member). However, to lookup the packet
482     in the registry, the mixin needs to know the key value. To this end, we implement \a
483     nextPacketKey(), which is very simple:
484
485     \code
486     static key_t nextPacketKey(packet p) { return p->protocolType(); }
487     \endcode
488
489     Since all \c GREPacketType members are static, they are passed the packet in question as an
490     argument. \a nextPacketKey() just needs to return the value of the correct packet field. And
491     since the \c packet type (as defined as a typedef) allows direct access to the packet parser
492     using the <tt>-></tt> operator, we can simply access that value.
493
494     The \c key_t return type is a typedef provided by the mixin class. It is taken from the type of
495     registry, in this case it is senf::EtherTypes::key_t (which is defined as a 16 bit unsigned
496     integer value).
497
498     With this information, the packet library can now find out the type of packet needed to parse
499     the GRE payload -- as long as the \a protocolType() is registered with the senf::EtherTypes
500     registry. If this is not the case, the packet library will not try to interpret the payload, it
501     will return a senf::DataPacket.
502
503     One special case of GRE encapsulation occurs when layer 2 frames and especially ethernet frames
504     are carried in the GRE payload. The ETHERTYPE registry normally only contains layer 3 protocols
505     (like IP or IPX) however for this special case, the value 0x6558 has been added to the ETHERTYPE
506     registry. So we need to add this value to inform the packet library to parse the payload as an
507     ethernet packet if the \a protocolType() is 0x6558. This happens in the implementation file (the
508     \c .cc file):
509
510     \code
511     #include <senf/Packets/DefaultBundle/EthernetPacket.hh>
512
513     SENF_PACKET_REGISTRY_REGISTER( senf::EtherTypes, 0x6558, senf::EthernetPacket );
514     \endcode
515
516     This macro registers the value 0x6558 in the senf::EtherTypes registry and associates it with
517     the packet type senf::EthernetPacket. This macro declares an anonymous static variable, it
518     therefore must always be placed in the implementation file and \e never in an include file.
519
520     Additionally, we want the GRE packet to be parsed when present as an IP payload. Therefore we
521     additionally need to register GRE in the senf::IpTypes registry. Looking at the <a
522     href="http://www.iana.org/assignments/protocol-numbers">IP protocol numbers</a>, we find that
523     GRE has been assigned the value 47:
524
525     \code
526     #include <senf/Packets/DefaultBundle/IPv4Packet.hh>
527
528     SENF_PACKET_REGISTRY_REGISTER( senf::IpTypes, 47, GREPacket );
529     \endcode
530
531     But wait -- what is \c GREPacket ? This question is answered a few section further down.
532     
533     The last thing we need to do is, we need to set the \a protocolType() field to the correct value
534     when packets are newly created or changed. This is done within \a finalize:
535
536     \code
537     static void finalize(packet p) { p->protocolType() << key(p.next(senf::nothrow)); }
538     \endcode
539
540     The \c key() function is provided by the mixin class: It will lookup the \e type of a packet in
541     the registry and return that packets key in the registry. If the key cannot be found, the return
542     value is such that the assignment is effectively skipped.
543
544
545     \subsection howto_newpacket_type_invariants Providing packet invariants
546
547     Many packets have some invariants that must hold: The payload size must be equal to some field,
548     a checksum must match and so on. When packets are newly created or changed, these invariants
549     have to be updated to be correct. This is the responsibility of the \a finalize() member.
550
551     \code
552     static void finalize(packet p) 
553     {
554         p->protocolType() << key(p.next(senf::nothrow));
555         if (p->checksumPresent())
556             p->checksum() << p->calculateChecksum();
557     }
558     \endcode
559
560     We already used finalize above to set the \a protocolType() field. Now we add code to update the
561     \a checksum() field if present (this always needs to be done last since the checksum depends on
562     the other field values).
563
564     Here we are using the more generic parser assignment expressed using the \c << operator. This
565     operator in the most cases works like an ordinary assignment, however it can also be used to
566     assign parsers to each other efficiently and it supports 'optional values' (as provided by <a
567     href="http://www.boost.org/libs/optional/doc/optional.html">Boost.Optional</a> and as returned
568     by \c key()).
569
570
571     \subsection howto_newpacket_type_dump Writing out a complete packet: The 'dump()' member
572
573     For diagnostic purposes, every packet should provide a meaningful \a dump() member which writes
574     out the complete packet. This member is simple to implement and is often very helpful when
575     tracking down problems.
576     
577     \code
578     #include <boost/io/ios_state.hpp>
579
580     static void dump(packet p, std::ostream & os)
581     {
582         boost::io::ios_all_saver ias(os);
583         os << "General Routing Encapsulation:\n"
584            << "  checksum present              : " << p->checksumPresent() ? "true" : "false" << "\n"
585            << "  version                       : " << p->version() << "\n"
586            << "  protocol type                 : 0x" << std::hex << std::setw(4) << std::setfill('0')
587                                                      << p->protocolType() << "\n";
588         if (p->checksumPresent())
589             os << "  checksum                     : 0x" << std::hex << std::setw(4)
590                                                         << std::setfill('0') << p->checksum() << "\n"; 
591     }
592     \endcode
593     
594     This member is quite straight forward. We should try to adhere to the formating standard shown
595     above: The first line should be the type of packet/header being dumped followed by one line for
596     each protocol field. The colon's should be aligned at column 33 with the field name indented by
597     2 spaces. 
598
599     The \c boost::ios_all_saver is just used to ensure, that the stream formatting state is restored
600     correctly at the end of the method. An instance of this type will save the stream state when
601     constructed and will restore that state when destructed.
602
603     \subsection howto_newpacket_type_final Final touches
604
605     The \c GREPacket implementation is now almost complete. The only thing missing is the \c
606     GREPacket itself. \c GREPacket is just a typedef for a specific senf::ConcretePacket template
607     instantiation. Here the complete GREPacket definition:
608
609     \code
610     #include <senf/Packets.hh>
611
612     struct GREPacketType
613         : public senf::PacketTypeBase,
614           public senf::PacketTypeMixin<GREPacketType, EtherTypes>
615     {
616         typedef senf::PacketTypeMixin<GREPacketType, EtherTypes> mixin;
617         typedef senf::ConcretePacket<GREPacketType> packet;
618         typedef senf::GREPacketParser parser;
619     
620         using mixin::nextPacketRange;
621         using mixin::nextPacketType;
622         using mixin::init;
623         using mixin::initSize;
624
625         static key_t nextPacketKey(packet p) { return p->protocolType(); }
626     
627         static void finalize(packet p) {
628             p->protocolType() << key(p.next(senf::nothrow)); 
629             if (p->checksumPresent()) p->checksum() << p->calculateChecksum();
630        }
631     
632         static void dump(packet p, std::ostream & os);
633     };
634
635     typedef GREPacketType::packet GREPacket;
636     
637     // In the implementation (.cc) file:
638
639     #include <senf/Packets/DefaultBundle/EthernetPacket.hh>
640     #include <senf/Packets/DefaultBundle/IPv4Packet.hh>
641
642     SENF_PACKET_REGISTRY_REGISTER( senf::EtherTypes, 0x6558, senf::EthernetPacket );
643     SENF_PACKET_REGISTRY_REGISTER( senf::IpTypes, 47, GREPacket );
644
645     void GREPacketType::dump(packet p, std::ostream & os)
646     {
647         boost::io::ios_all_saver ias(os);
648         os << "General Routing Encapsulation:\n"
649            << "  checksum present              : " << p->checksumPresent() ? "true" : "false" << "\n"
650            << "  version                       : " << p->version() << "\n"
651            << "  protocol type                 : 0x" << std::hex << std::setw(4) << std::setfill('0')
652                                                      << p->protocolType() << "\n";
653         if (p->checksumPresent())
654             os << "  checksum                     : 0x" << std::hex << std::setw(4)
655                                                         << std::setfill('0') << p->checksum() << "\n"; 
656     }
657     \endcode
658
659
660     \section howto_newpacket_advanced Going further
661
662     \subsection howto_newpacket_advanced_valid Checking the GRE packet for validity
663
664     We now know how to define packets, but there is more. In this section we will explore the
665     features available to make the packet chaining more flexible. We will show, how to implement
666     more complex logic than simple registry lookup to find the nested packet (the payload) type.
667
668     In our concrete example, reading the RFC we find there are some restrictions which a GRE packet
669     needs to obey to be considered valid. If the packet is not valid it cannot be parsed and should
670     be dropped. We can't drop it here but if the packet is invalid, we certainly must refrain from
671     trying to parser any payload since we cannot assume the packet to have the format we assume our
672     GRE packet to have. 
673
674     There are two conditions defined in the RFC which render a GRE packet invalid: If one of the \a
675     reserved0() fields first 5 bits is set or if the version is not 0. We will add a \a valid()
676     check to the parser and utilize this check in the packet type.
677
678     So first lets update the parser. We will need to change the fields a little bit so we have
679     access to the first 5 bits of \a reserved0. We therefore replace the first three field
680     statements with
681
682     \code
683     SENF_PARSER_BITFIELD_RO      ( checksumPresent,  1, bool                      );
684     SENF_PARSER_PRIVATE_BITFIELD ( reserved0_5bits_, 5, unsigned                  );
685     SENF_PARSER_SKIP_BITS        (                   7                            );
686     SENF_PARSER_BITFIELD_RO      ( version,          3, unsigned                  );
687     \endcode
688
689     We have added an additional private bitfield \a reserved0_5bits_() and we made the \a version()
690     field read-only.
691
692     We will now add a simple additional member to the parser:
693
694     \code
695     bool valid() const { return version() == 0 && reserved0_5bits_() == 0; }
696     \endcode
697
698     I think, this is quite straight forward: \a valid() will just check the restrictions as defined
699     in the RFC.
700
701     Now to the packet type. We want to refrain from parsing the payload if the packet is
702     invalid. This is important: If the packet is not valid, we have no idea, whether the payload is
703     what we surmise it to be (if any of the \a reserved0_5bits_() are set, the packet is from an
704     older GRE RFC and the header is quite a bit longer so the payload will be incorrect).
705
706     So we need to change the logic which is used by the packet library to find the type of the next
707     packet. We have two ways to do this: We keep using the default \c nextPacketType()
708     implementation as provided by the senf::PacketTypeMixin and have our \a nextPacketKey()
709     implementation return a key value which is guaranteed never to be registered in the registry.
710
711     The more flexible possibility is implementing \c nextPacketType() ourselves. In this case, the
712     first method would suffice, but we will choose to go the second route to show how to write the
713     \c nextPacketType() member. We therefore remove the \c using declaration of \c nextPacketType()
714     and also remove the \a nextPacketKey() implementation. Instead we add the following to the
715     packet type
716
717     \code
718     // disabled: using mixin::nextPacketType;
719
720     factory_t nextPacketType(packet p) { return p->valid() ? lookup(p->protocolType()) : no_factory(); }
721     \endcode
722     
723     As we see, this is still quite simple. \c factory_t is provided by senf::PacketTypeBase. For our
724     purpose it is an opaque type which somehow enables the packet library to create a new packet of
725     a specified packet type. The \c factory_t has a special value, \c no_factory() which stands for
726     the absence of any concrete factory. In a boolean context this (and only this) \c factory_t
727     value tests \c false.
728
729     The \c lookup() member is provided by the senf::PacketTypeMixin. It looks up the key passed as
730     argument in the registry and returns the factory or \c no_factory(), if the key was not found in
731     the registry.
732
733     In this case this is all. But let's elaborate on this example. What if we need to return some
734     specific factory from \a nextPacketType(), e.g. what, if we want to handle the case of
735     transparent ethernet bridging explicitly instead of registering the value in the
736     senf::EtherTypes registry ? Here one way to do this:
737
738     \code
739     factory_t nextPacketType(packet p) { 
740         if (p->valid()) {
741             if (p->protocolType() == 0x6558)  return senf::EthernetPacket::factory();
742             else                              return lookup(p->protocolType());
743         }
744         else                                  return no_factory();
745     }
746     \endcode
747
748     As can be seen above, every packet type has a (static) \a factory() member which returns the
749     factory for this type of packet.
750
751
752     \subsection howto_newpacket_advanced_init Non-trivial packet initialization
753
754     Every packet when created is automatically initialized with 0 bytes (all data bytes will be
755     0). In the case of GRE this is enough. But other packets will need other more complex
756     initialization to be performed.
757
758     Lets just for the sake of experiment assume, the GRE packet would have to set \a version() to 1
759     not 0. In this case, the default initialization would not suffice. It is however very simple to
760     explicitly initialize the packet. The initialization happens within the parser. We just add
761
762     \code
763     SENF_PARSER_INIT() { version_() << 1u; }
764     \endcode
765
766     to \c GREPacketParser. For every read-only defined field, the macros automatically define a \e
767     private read-write accessor which may be used internally. This read-write accessor is used here
768     to initialize the value.
769
770
771     \section howto_newpacket_final The ultimate GRE packet implementation completed
772
773     So here we now have \c GREPacket finally complete in all it's glory. First the header file \c
774     GREPacket.hh:
775
776     \code
777     #ifndef HH_GREPacket_
778     #define HH_GREPacket_
779
780     #include <senf/Packets.hh>
781     
782     struct GREPacketParser_OptFields : public senf::PacketParserBase
783     {
784     #   include SENF_FIXED_PARSER()
785
786         SENF_PARSER_FIELD           ( checksum,        senf::UInt16Parser            );
787         SENF_PARSER_SKIP            (                   2                            );
788
789         SENF_PARSER_FINALIZE(GREPacketParser_OptFields);
790     };
791
792     struct GREPacketParser : public senf::PacketParserBase
793     {
794     #   include SENF_PARSER()
795
796         SENF_PARSER_BITFIELD_RO      ( checksumPresent,  1, bool                      );
797         SENF_PARSER_PRIVATE_BITFIELD ( reserved0_5bits_, 5, unsigned                  );
798         SENF_PARSER_SKIP_BITS        (                   7                            );
799         SENF_PARSER_BITFIELD_RO      ( version,          3, unsigned                  );
800
801         SENF_PARSER_FIELD            ( protocolType,    senf::UInt16Parser            );
802
803         SENF_PARSER_PRIVATE_VARIANT ( optionalFields_, checksumPresent,
804                                           (novalue(disable_checksum, senf::VoidPacketParser))
805                                           (     id(checksum,         GREPacketParser_OptFields)) );
806
807         bool valid() const { return version() == 0 && reserved0_5bits_() == 0; }
808
809         SENF_PARSER_FINALIZE(GREPacketParser);
810
811         checksum_t::checksum_t::value_type calculateChecksum() const;
812     };
813
814     struct GREPacketType
815         : public senf::PacketTypeBase,
816           public senf::PacketTypeMixin<GREPacketType, EtherTypes>
817     {
818         typedef senf::PacketTypeMixin<GREPacketType, EtherTypes> mixin;
819         typedef senf::ConcretePacket<GREPacketType> packet;
820         typedef senf::GREPacketParser parser;
821     
822         using mixin::nextPacketRange;
823         using mixin::init;
824         using mixin::initSize;
825
826         factory_t nextPacketType(packet p) 
827             { return p->valid() ? lookup(p->protocolType()) : no_factory(); }
828     
829         static void finalize(packet p) {
830             p->protocolType() << key(p.next(senf::nothrow));
831             if (p->checksumPresent()) p->checksum() << p->calculateChecksum();
832         }
833     
834         static void dump(packet p, std::ostream & os);
835     };
836
837     typedef GREPacketType::packet GREPacket;
838     
839     #endif
840     \endcode
841
842     And the implementation file \c GREPacket.cc:
843
844     \code
845     #include "GREPacket.hh"
846     #include <senf/Utils/IpChecksum.hh>
847     #include <senf/Packets/DefaultBundle/EthernetPacket.hh>
848     #include <senf/Packets/DefaultBundle/IPv4Packet.hh>
849
850     SENF_PACKET_REGISTRY_REGISTER( senf::EtherTypes, 0x6558, senf::EthernetPacket );
851     SENF_PACKET_REGISTRY_REGISTER( senf::IpTypes, 47, GREPacket );
852
853     GREPacketParser::checksum_t::checksum_t::value_type GREPacketParser::calculateChecksum() const
854     {
855         if (!checksumEnabled()) 
856             return 0;
857
858         validate(6);
859         senf::IpChecksum cs;
860         cs.feed( i(), i()+4 );
861         // Skip even number of 0 bytes (the 2 bytes checksum field)
862         // cs.feed(0); cs.feed(0);
863         cs.feed( i()+6, data().end() );
864
865         return cs.sum()
866     }
867
868     void GREPacketType::dump(packet p, std::ostream & os)
869     {
870         boost::io::ios_all_saver ias(os);
871         os << "General Routing Encapsulation:\n"
872            << "  checksum present              : " << p->checksumPresent() ? "true" : "false" << "\n"
873            << "  version                       : " << p->version() << "\n"
874            << "  protocol type                 : 0x" << std::hex << std::setw(4) << std::setfill('0')
875                                                      << p->protocolType() << "\n";
876         if (p->checksumPresent())
877             os << "  checksum                     : 0x" << std::hex << std::setw(4)
878                                                         << std::setfill('0') << p->checksum() << "\n"; 
879     }
880     \endcode
881
882
883     \section howto_newpacket_using Using the newly created GRE packet type
884
885     The GRE packet is now fully integrated into the packet library framework. For example, we can
886     read GRE packets from a raw INet socket and forward decapsulated Ethernet frames to a packet
887     socket.
888
889     \code
890     #include <iostream>
891     #include <senf/Packets.hh>
892     #include <senf/Packets/DefaultBundle/EthernetPacket.hh>
893     #include <senf/Socket/Protocols/INet/RawINetProtocol.hh>
894     #include <senf/Socket/Protocols/Raw/PacketSocketHandle.hh>
895     #include "GREPacket.hh"
896
897     int main(int, char const **)
898     {
899         senf::RawV6ClientSocketHandle isock (47u); // 47 = Read GRE packets
900         senf::PacketSocketHandle osock;
901
902         while (true) {
903             try {
904                 GREPacket gre (GREPacket::create(senf::noinit));
905                 isock.read(gre.data(),0u);
906                 if (gre->checksumPresent() && gre->checksum() != gre->calculateChecksum())
907                     throw InvalidPacketChainException();
908                 osock.write(gre.next<EthernetPacket>().data())
909             }
910             catch (senf::TruncatedPacketException & ex) {
911                 std::cerr << "Malformed packet dropped\n";
912             }
913             catch (senf::InvalidPacketChainException & ex) {
914                 std::cerr << "Invalid GRE packet dropped\n";
915             }
916         }
917     }
918     \endcode
919
920     Or we can do the opposite: Read ethernet packets from a \c tap device and send them out GRE
921     encapsulated.
922
923     \code
924     #include <iostream>
925     #include <senf/Packets.hh>
926     #include <senf/Packets/DefaultBundle/EthernetPacket.hh>
927     #include <senf/Socket/Protocols/INet/RawINetProtocol.hh>
928     #include <senf/Socket/Protocols/Raw/TunTapSocketHandle.hh>
929     #include "GREPacket.hh"
930
931     int main(int argc, char const ** argv)
932     {
933         if (argc != 2) {
934             std::cerr << "Usage: " << argv[0] << " <tunnel endpoint>\n";
935             return 1;
936         }
937
938         senf::TapSocketHandle tap ("tap0");
939         senf::ConnectedRawV6ClientSocketHandle osock (47u, senf::INet6SocketAddress(argv[1]));
940     
941         while (true) {
942             senf::EthernetPacket eth (senf::EthernetPacket::create(senf::noinit));
943             isock.read(eth.data(),0u);
944             GREPacket gre (senf::GREPacket::createBefore(eth));
945             gre.finalize();
946             osock.write(gre.data());
947         }
948     }
949     \endcode
950
951     
952     \section howto_newpacket_further Further reading
953
954     Lets start with references to the important API's (Use the <i>List of all members</i> link to
955     get the complete API of one of the classes and templates):
956
957     <table class="senf fixedcolumn">
958
959     <tr><td>senf::ConcretePacket</td> <td>this is the API provided by the packet handles.</td></tr>
960
961     <tr><td>senf::PacketData</td> <td>this API provides raw data access accessible via the handles
962     'data' member.</td></tr>
963
964     <tr><td>senf::PacketParserBase</td> <td>this is the generic parser API. This API is accessible
965     via the packets \c -> operator or via the sub-parsers returned by the field accessors.</td></tr>
966
967     </table>
968
969     When implementing new packet's, the following information will be helpful:
970
971     <table class="senf fixedcolumn">
972     
973     <tr><td>senf::PacketTypeBase</td> <td>here you find a description of the members which need to
974     be implemented to provide a 'packet type'. Most of these members will normally be provided by
975     the mixin helper.</td></tr>
976
977     <tr><td>senf::PacketTypeMixin</td> <td>here you find all about the packet type mixin and how to
978     use it.</td></tr>
979
980     <tr><td>\ref packetparser</td> <td>This section describes the packet parser facility.</td></tr>
981     
982     <tr><td>\link packetparsermacros Packet parser macros\endlink</td> <td>A complete list and
983     documentation of all the packet parser macros.</td></tr>
984     
985     <tr><td>\ref parseint, \n \ref parsecollection</td> <td>There are several lists of available
986     reusable packet parsers. However, these lists are not complete as there are other protocol
987     specific reusable parsers (without claiming to be exhaustive: senf::INet4AddressParser,
988     senf::INet6AddressParser, senf::MACAddressParser)</td></tr>
989
990     </table>
991
992  */
993
994 \f
995 // Local Variables:
996 // mode: c++
997 // fill-column: 100
998 // comment-column: 40
999 // c-file-style: "senf"
1000 // indent-tabs-mode: nil
1001 // ispell-local-dictionary: "american"
1002 // compile-command: "scons -u doc"
1003 // mode: auto-fill
1004 // End:
1005 // vim:filetype=doxygen:textwidth=100: