d584eadd82650c63c853bcc07ee0c0a638b0dedd
[zfs.git] / cmd / zinject / zinject.c
1 /*
2  * CDDL HEADER START
3  *
4  * The contents of this file are subject to the terms of the
5  * Common Development and Distribution License (the "License").
6  * You may not use this file except in compliance with the License.
7  *
8  * You can obtain a copy of the license at usr/src/OPENSOLARIS.LICENSE
9  * or http://www.opensolaris.org/os/licensing.
10  * See the License for the specific language governing permissions
11  * and limitations under the License.
12  *
13  * When distributing Covered Code, include this CDDL HEADER in each
14  * file and include the License file at usr/src/OPENSOLARIS.LICENSE.
15  * If applicable, add the following below this CDDL HEADER, with the
16  * fields enclosed by brackets "[]" replaced with your own identifying
17  * information: Portions Copyright [yyyy] [name of copyright owner]
18  *
19  * CDDL HEADER END
20  */
21 /*
22  * Copyright (c) 2005, 2010, Oracle and/or its affiliates. All rights reserved.
23  */
24
25 /*
26  * ZFS Fault Injector
27  *
28  * This userland component takes a set of options and uses libzpool to translate
29  * from a user-visible object type and name to an internal representation.
30  * There are two basic types of faults: device faults and data faults.
31  *
32  *
33  * DEVICE FAULTS
34  *
35  * Errors can be injected into a particular vdev using the '-d' option.  This
36  * option takes a path or vdev GUID to uniquely identify the device within a
37  * pool.  There are two types of errors that can be injected, EIO and ENXIO,
38  * that can be controlled through the '-e' option.  The default is ENXIO.  For
39  * EIO failures, any attempt to read data from the device will return EIO, but
40  * subsequent attempt to reopen the device will succeed.  For ENXIO failures,
41  * any attempt to read from the device will return EIO, but any attempt to
42  * reopen the device will also return ENXIO.
43  * For label faults, the -L option must be specified. This allows faults
44  * to be injected into either the nvlist, uberblock, pad1, or pad2 region
45  * of all the labels for the specified device.
46  *
47  * This form of the command looks like:
48  *
49  *      zinject -d device [-e errno] [-L <uber | nvlist | pad1 | pad2>] pool
50  *
51  *
52  * DATA FAULTS
53  *
54  * We begin with a tuple of the form:
55  *
56  *      <type,level,range,object>
57  *
58  *      type    A string describing the type of data to target.  Each type
59  *              implicitly describes how to interpret 'object'. Currently,
60  *              the following values are supported:
61  *
62  *              data            User data for a file
63  *              dnode           Dnode for a file or directory
64  *
65  *              The following MOS objects are special.  Instead of injecting
66  *              errors on a particular object or blkid, we inject errors across
67  *              all objects of the given type.
68  *
69  *              mos             Any data in the MOS
70  *              mosdir          object directory
71  *              config          pool configuration
72  *              bpobj           blkptr list
73  *              spacemap        spacemap
74  *              metaslab        metaslab
75  *              errlog          persistent error log
76  *
77  *      level   Object level.  Defaults to '0', not applicable to all types.  If
78  *              a range is given, this corresponds to the indirect block
79  *              corresponding to the specific range.
80  *
81  *      range   A numerical range [start,end) within the object.  Defaults to
82  *              the full size of the file.
83  *
84  *      object  A string describing the logical location of the object.  For
85  *              files and directories (currently the only supported types),
86  *              this is the path of the object on disk.
87  *
88  * This is translated, via libzpool, into the following internal representation:
89  *
90  *      <type,objset,object,level,range>
91  *
92  * These types should be self-explanatory.  This tuple is then passed to the
93  * kernel via a special ioctl() to initiate fault injection for the given
94  * object.  Note that 'type' is not strictly necessary for fault injection, but
95  * is used when translating existing faults into a human-readable string.
96  *
97  *
98  * The command itself takes one of the forms:
99  *
100  *      zinject
101  *      zinject <-a | -u pool>
102  *      zinject -c <id|all>
103  *      zinject [-q] <-t type> [-f freq] [-u] [-a] [-m] [-e errno] [-l level]
104  *          [-r range] <object>
105  *      zinject [-f freq] [-a] [-m] [-u] -b objset:object:level:start:end pool
106  *
107  * With no arguments, the command prints all currently registered injection
108  * handlers, with their numeric identifiers.
109  *
110  * The '-c' option will clear the given handler, or all handlers if 'all' is
111  * specified.
112  *
113  * The '-e' option takes a string describing the errno to simulate.  This must
114  * be either 'io' or 'checksum'.  In most cases this will result in the same
115  * behavior, but RAID-Z will produce a different set of ereports for this
116  * situation.
117  *
118  * The '-a', '-u', and '-m' flags toggle internal flush behavior.  If '-a' is
119  * specified, then the ARC cache is flushed appropriately.  If '-u' is
120  * specified, then the underlying SPA is unloaded.  Either of these flags can be
121  * specified independently of any other handlers.  The '-m' flag automatically
122  * does an unmount and remount of the underlying dataset to aid in flushing the
123  * cache.
124  *
125  * The '-f' flag controls the frequency of errors injected, expressed as a
126  * integer percentage between 1 and 100.  The default is 100.
127  *
128  * The this form is responsible for actually injecting the handler into the
129  * framework.  It takes the arguments described above, translates them to the
130  * internal tuple using libzpool, and then issues an ioctl() to register the
131  * handler.
132  *
133  * The final form can target a specific bookmark, regardless of whether a
134  * human-readable interface has been designed.  It allows developers to specify
135  * a particular block by number.
136  */
137
138 #include <errno.h>
139 #include <fcntl.h>
140 #include <stdio.h>
141 #include <stdlib.h>
142 #include <strings.h>
143 #include <unistd.h>
144
145 #include <sys/fs/zfs.h>
146 #include <sys/mount.h>
147
148 #include <libzfs.h>
149
150 #undef verify   /* both libzfs.h and zfs_context.h want to define this */
151
152 #include "zinject.h"
153
154 libzfs_handle_t *g_zfs;
155 int zfs_fd;
156
157 #define ECKSUM  EBADE
158
159 static const char *errtable[TYPE_INVAL] = {
160         "data",
161         "dnode",
162         "mos",
163         "mosdir",
164         "metaslab",
165         "config",
166         "bpobj",
167         "spacemap",
168         "errlog",
169         "uber",
170         "nvlist",
171         "pad1",
172         "pad2"
173 };
174
175 static err_type_t
176 name_to_type(const char *arg)
177 {
178         int i;
179         for (i = 0; i < TYPE_INVAL; i++)
180                 if (strcmp(errtable[i], arg) == 0)
181                         return (i);
182
183         return (TYPE_INVAL);
184 }
185
186 static const char *
187 type_to_name(uint64_t type)
188 {
189         switch (type) {
190         case DMU_OT_OBJECT_DIRECTORY:
191                 return ("mosdir");
192         case DMU_OT_OBJECT_ARRAY:
193                 return ("metaslab");
194         case DMU_OT_PACKED_NVLIST:
195                 return ("config");
196         case DMU_OT_BPOBJ:
197                 return ("bpobj");
198         case DMU_OT_SPACE_MAP:
199                 return ("spacemap");
200         case DMU_OT_ERROR_LOG:
201                 return ("errlog");
202         default:
203                 return ("-");
204         }
205 }
206
207
208 /*
209  * Print usage message.
210  */
211 void
212 usage(void)
213 {
214         (void) printf(
215             "usage:\n"
216             "\n"
217             "\tzinject\n"
218             "\n"
219             "\t\tList all active injection records.\n"
220             "\n"
221             "\tzinject -c <id|all>\n"
222             "\n"
223             "\t\tClear the particular record (if given a numeric ID), or\n"
224             "\t\tall records if 'all' is specificed.\n"
225             "\n"
226             "\tzinject -p <function name> pool\n"
227             "\t\tInject a panic fault at the specified function. Only \n"
228             "\t\tfunctions which call spa_vdev_config_exit(), or \n"
229             "\t\tspa_vdev_exit() will trigger a panic.\n"
230             "\n"
231             "\tzinject -d device [-e errno] [-L <nvlist|uber|pad1|pad2>] [-F]\n"
232             "\t    [-T <read|write|free|claim|all> pool\n"
233             "\t\tInject a fault into a particular device or the device's\n"
234             "\t\tlabel.  Label injection can either be 'nvlist', 'uber',\n "
235             "\t\t'pad1', or 'pad2'.\n"
236             "\t\t'errno' can be 'nxio' (the default), 'io', or 'dtl'.\n"
237             "\n"
238             "\tzinject -d device -A <degrade|fault> pool\n"
239             "\t\tPerform a specific action on a particular device\n"
240             "\n"
241             "\tzinject -I [-s <seconds> | -g <txgs>] pool\n"
242             "\t\tCause the pool to stop writing blocks yet not\n"
243             "\t\treport errors for a duration.  Simulates buggy hardware\n"
244             "\t\tthat fails to honor cache flush requests.\n"
245             "\t\tDefault duration is 30 seconds.  The machine is panicked\n"
246             "\t\tat the end of the duration.\n"
247             "\n"
248             "\tzinject -b objset:object:level:blkid pool\n"
249             "\n"
250             "\t\tInject an error into pool 'pool' with the numeric bookmark\n"
251             "\t\tspecified by the remaining tuple.  Each number is in\n"
252             "\t\thexidecimal, and only one block can be specified.\n"
253             "\n"
254             "\tzinject [-q] <-t type> [-e errno] [-l level] [-r range]\n"
255             "\t    [-a] [-m] [-u] [-f freq] <object>\n"
256             "\n"
257             "\t\tInject an error into the object specified by the '-t' option\n"
258             "\t\tand the object descriptor.  The 'object' parameter is\n"
259             "\t\tinterperted depending on the '-t' option.\n"
260             "\n"
261             "\t\t-q\tQuiet mode.  Only print out the handler number added.\n"
262             "\t\t-e\tInject a specific error.  Must be either 'io' or\n"
263             "\t\t\t'checksum'.  Default is 'io'.\n"
264             "\t\t-l\tInject error at a particular block level. Default is "
265             "0.\n"
266             "\t\t-m\tAutomatically remount underlying filesystem.\n"
267             "\t\t-r\tInject error over a particular logical range of an\n"
268             "\t\t\tobject.  Will be translated to the appropriate blkid\n"
269             "\t\t\trange according to the object's properties.\n"
270             "\t\t-a\tFlush the ARC cache.  Can be specified without any\n"
271             "\t\t\tassociated object.\n"
272             "\t\t-u\tUnload the associated pool.  Can be specified with only\n"
273             "\t\t\ta pool object.\n"
274             "\t\t-f\tOnly inject errors a fraction of the time.  Expressed as\n"
275             "\t\t\ta percentage between 1 and 100.\n"
276             "\n"
277             "\t-t data\t\tInject an error into the plain file contents of a\n"
278             "\t\t\tfile.  The object must be specified as a complete path\n"
279             "\t\t\tto a file on a ZFS filesystem.\n"
280             "\n"
281             "\t-t dnode\tInject an error into the metadnode in the block\n"
282             "\t\t\tcorresponding to the dnode for a file or directory.  The\n"
283             "\t\t\t'-r' option is incompatible with this mode.  The object\n"
284             "\t\t\tis specified as a complete path to a file or directory\n"
285             "\t\t\ton a ZFS filesystem.\n"
286             "\n"
287             "\t-t <mos>\tInject errors into the MOS for objects of the given\n"
288             "\t\t\ttype.  Valid types are: mos, mosdir, config, bpobj,\n"
289             "\t\t\tspacemap, metaslab, errlog.  The only valid <object> is\n"
290             "\t\t\tthe poolname.\n");
291 }
292
293 static int
294 iter_handlers(int (*func)(int, const char *, zinject_record_t *, void *),
295     void *data)
296 {
297         zfs_cmd_t zc;
298         int ret;
299
300         zc.zc_guid = 0;
301
302         while (ioctl(zfs_fd, ZFS_IOC_INJECT_LIST_NEXT, &zc) == 0)
303                 if ((ret = func((int)zc.zc_guid, zc.zc_name,
304                     &zc.zc_inject_record, data)) != 0)
305                         return (ret);
306
307         if (errno != ENOENT) {
308                 (void) fprintf(stderr, "Unable to list handlers: %s\n",
309                     strerror(errno));
310                 return (-1);
311         }
312
313         return (0);
314 }
315
316 static int
317 print_data_handler(int id, const char *pool, zinject_record_t *record,
318     void *data)
319 {
320         int *count = data;
321
322         if (record->zi_guid != 0 || record->zi_func[0] != '\0')
323                 return (0);
324
325         if (*count == 0) {
326                 (void) printf("%3s  %-15s  %-6s  %-6s  %-8s  %3s  %-15s\n",
327                     "ID", "POOL", "OBJSET", "OBJECT", "TYPE", "LVL",  "RANGE");
328                 (void) printf("---  ---------------  ------  "
329                     "------  --------  ---  ---------------\n");
330         }
331
332         *count += 1;
333
334         (void) printf("%3d  %-15s  %-6llu  %-6llu  %-8s  %3d  ", id, pool,
335             (u_longlong_t)record->zi_objset, (u_longlong_t)record->zi_object,
336             type_to_name(record->zi_type), record->zi_level);
337
338         if (record->zi_start == 0 &&
339             record->zi_end == -1ULL)
340                 (void) printf("all\n");
341         else
342                 (void) printf("[%llu, %llu]\n", (u_longlong_t)record->zi_start,
343                     (u_longlong_t)record->zi_end);
344
345         return (0);
346 }
347
348 static int
349 print_device_handler(int id, const char *pool, zinject_record_t *record,
350     void *data)
351 {
352         int *count = data;
353
354         if (record->zi_guid == 0 || record->zi_func[0] != '\0')
355                 return (0);
356
357         if (*count == 0) {
358                 (void) printf("%3s  %-15s  %s\n", "ID", "POOL", "GUID");
359                 (void) printf("---  ---------------  ----------------\n");
360         }
361
362         *count += 1;
363
364         (void) printf("%3d  %-15s  %llx\n", id, pool,
365             (u_longlong_t)record->zi_guid);
366
367         return (0);
368 }
369
370 static int
371 print_panic_handler(int id, const char *pool, zinject_record_t *record,
372     void *data)
373 {
374         int *count = data;
375
376         if (record->zi_func[0] == '\0')
377                 return (0);
378
379         if (*count == 0) {
380                 (void) printf("%3s  %-15s  %s\n", "ID", "POOL", "FUNCTION");
381                 (void) printf("---  ---------------  ----------------\n");
382         }
383
384         *count += 1;
385
386         (void) printf("%3d  %-15s  %s\n", id, pool, record->zi_func);
387
388         return (0);
389 }
390
391 /*
392  * Print all registered error handlers.  Returns the number of handlers
393  * registered.
394  */
395 static int
396 print_all_handlers(void)
397 {
398         int count = 0, total = 0;
399
400         (void) iter_handlers(print_device_handler, &count);
401         if (count > 0) {
402                 total += count;
403                 (void) printf("\n");
404                 count = 0;
405         }
406
407         (void) iter_handlers(print_data_handler, &count);
408         if (count > 0) {
409                 total += count;
410                 (void) printf("\n");
411                 count = 0;
412         }
413
414         (void) iter_handlers(print_panic_handler, &count);
415
416         return (count + total);
417 }
418
419 /* ARGSUSED */
420 static int
421 cancel_one_handler(int id, const char *pool, zinject_record_t *record,
422     void *data)
423 {
424         zfs_cmd_t zc;
425
426         zc.zc_guid = (uint64_t)id;
427
428         if (ioctl(zfs_fd, ZFS_IOC_CLEAR_FAULT, &zc) != 0) {
429                 (void) fprintf(stderr, "failed to remove handler %d: %s\n",
430                     id, strerror(errno));
431                 return (1);
432         }
433
434         return (0);
435 }
436
437 /*
438  * Remove all fault injection handlers.
439  */
440 static int
441 cancel_all_handlers(void)
442 {
443         int ret = iter_handlers(cancel_one_handler, NULL);
444
445         if (ret == 0)
446                 (void) printf("removed all registered handlers\n");
447
448         return (ret);
449 }
450
451 /*
452  * Remove a specific fault injection handler.
453  */
454 static int
455 cancel_handler(int id)
456 {
457         zfs_cmd_t zc;
458
459         zc.zc_guid = (uint64_t)id;
460
461         if (ioctl(zfs_fd, ZFS_IOC_CLEAR_FAULT, &zc) != 0) {
462                 (void) fprintf(stderr, "failed to remove handler %d: %s\n",
463                     id, strerror(errno));
464                 return (1);
465         }
466
467         (void) printf("removed handler %d\n", id);
468
469         return (0);
470 }
471
472 /*
473  * Register a new fault injection handler.
474  */
475 static int
476 register_handler(const char *pool, int flags, zinject_record_t *record,
477     int quiet)
478 {
479         zfs_cmd_t zc;
480
481         (void) strcpy(zc.zc_name, pool);
482         zc.zc_inject_record = *record;
483         zc.zc_guid = flags;
484
485         if (ioctl(zfs_fd, ZFS_IOC_INJECT_FAULT, &zc) != 0) {
486                 (void) fprintf(stderr, "failed to add handler: %s\n",
487                     strerror(errno));
488                 return (1);
489         }
490
491         if (flags & ZINJECT_NULL)
492                 return (0);
493
494         if (quiet) {
495                 (void) printf("%llu\n", (u_longlong_t)zc.zc_guid);
496         } else {
497                 (void) printf("Added handler %llu with the following "
498                     "properties:\n", (u_longlong_t)zc.zc_guid);
499                 (void) printf("  pool: %s\n", pool);
500                 if (record->zi_guid) {
501                         (void) printf("  vdev: %llx\n",
502                             (u_longlong_t)record->zi_guid);
503                 } else if (record->zi_func[0] != '\0') {
504                         (void) printf("  panic function: %s\n",
505                             record->zi_func);
506                 } else if (record->zi_duration > 0) {
507                         (void) printf(" time: %lld seconds\n",
508                             (u_longlong_t)record->zi_duration);
509                 } else if (record->zi_duration < 0) {
510                         (void) printf(" txgs: %lld \n",
511                             (u_longlong_t)-record->zi_duration);
512                 } else {
513                         (void) printf("objset: %llu\n",
514                             (u_longlong_t)record->zi_objset);
515                         (void) printf("object: %llu\n",
516                             (u_longlong_t)record->zi_object);
517                         (void) printf("  type: %llu\n",
518                             (u_longlong_t)record->zi_type);
519                         (void) printf(" level: %d\n", record->zi_level);
520                         if (record->zi_start == 0 &&
521                             record->zi_end == -1ULL)
522                                 (void) printf(" range: all\n");
523                         else
524                                 (void) printf(" range: [%llu, %llu)\n",
525                                     (u_longlong_t)record->zi_start,
526                                     (u_longlong_t)record->zi_end);
527                 }
528         }
529
530         return (0);
531 }
532
533 int
534 perform_action(const char *pool, zinject_record_t *record, int cmd)
535 {
536         zfs_cmd_t zc;
537
538         ASSERT(cmd == VDEV_STATE_DEGRADED || cmd == VDEV_STATE_FAULTED);
539         (void) strlcpy(zc.zc_name, pool, sizeof (zc.zc_name));
540         zc.zc_guid = record->zi_guid;
541         zc.zc_cookie = cmd;
542
543         if (ioctl(zfs_fd, ZFS_IOC_VDEV_SET_STATE, &zc) == 0)
544                 return (0);
545
546         return (1);
547 }
548
549 int
550 main(int argc, char **argv)
551 {
552         int c;
553         char *range = NULL;
554         char *cancel = NULL;
555         char *end;
556         char *raw = NULL;
557         char *device = NULL;
558         int level = 0;
559         int quiet = 0;
560         int error = 0;
561         int domount = 0;
562         int io_type = ZIO_TYPES;
563         int action = VDEV_STATE_UNKNOWN;
564         err_type_t type = TYPE_INVAL;
565         err_type_t label = TYPE_INVAL;
566         zinject_record_t record = { 0 };
567         char pool[MAXNAMELEN];
568         char dataset[MAXNAMELEN];
569         zfs_handle_t *zhp = NULL;
570         int nowrites = 0;
571         int dur_txg = 0;
572         int dur_secs = 0;
573         int ret;
574         int flags = 0;
575
576         if (argc == 1) {
577                 /*
578                  * No arguments.  Print the available handlers.  If there are no
579                  * available handlers, direct the user to '-h' for help
580                  * information.
581                  */
582                 if (print_all_handlers() == 0) {
583                         (void) printf("No handlers registered.\n");
584                         (void) printf("Run 'zinject -h' for usage "
585                             "information.\n");
586                 }
587
588                 return (0);
589         }
590
591         while ((c = getopt(argc, argv,
592             ":aA:b:d:f:Fg:qhIc:t:T:l:mr:s:e:uL:p:")) != -1) {
593                 switch (c) {
594                 case 'a':
595                         flags |= ZINJECT_FLUSH_ARC;
596                         break;
597                 case 'A':
598                         if (strcasecmp(optarg, "degrade") == 0) {
599                                 action = VDEV_STATE_DEGRADED;
600                         } else if (strcasecmp(optarg, "fault") == 0) {
601                                 action = VDEV_STATE_FAULTED;
602                         } else {
603                                 (void) fprintf(stderr, "invalid action '%s': "
604                                     "must be 'degrade' or 'fault'\n", optarg);
605                                 usage();
606                                 return (1);
607                         }
608                         break;
609                 case 'b':
610                         raw = optarg;
611                         break;
612                 case 'c':
613                         cancel = optarg;
614                         break;
615                 case 'd':
616                         device = optarg;
617                         break;
618                 case 'e':
619                         if (strcasecmp(optarg, "io") == 0) {
620                                 error = EIO;
621                         } else if (strcasecmp(optarg, "checksum") == 0) {
622                                 error = ECKSUM;
623                         } else if (strcasecmp(optarg, "nxio") == 0) {
624                                 error = ENXIO;
625                         } else if (strcasecmp(optarg, "dtl") == 0) {
626                                 error = ECHILD;
627                         } else {
628                                 (void) fprintf(stderr, "invalid error type "
629                                     "'%s': must be 'io', 'checksum' or "
630                                     "'nxio'\n", optarg);
631                                 usage();
632                                 return (1);
633                         }
634                         break;
635                 case 'f':
636                         record.zi_freq = atoi(optarg);
637                         if (record.zi_freq < 1 || record.zi_freq > 100) {
638                                 (void) fprintf(stderr, "frequency range must "
639                                     "be in the range (0, 100]\n");
640                                 return (1);
641                         }
642                         break;
643                 case 'F':
644                         record.zi_failfast = B_TRUE;
645                         break;
646                 case 'g':
647                         dur_txg = 1;
648                         record.zi_duration = (int)strtol(optarg, &end, 10);
649                         if (record.zi_duration <= 0 || *end != '\0') {
650                                 (void) fprintf(stderr, "invalid duration '%s': "
651                                     "must be a positive integer\n", optarg);
652                                 usage();
653                                 return (1);
654                         }
655                         /* store duration of txgs as its negative */
656                         record.zi_duration *= -1;
657                         break;
658                 case 'h':
659                         usage();
660                         return (0);
661                 case 'I':
662                         /* default duration, if one hasn't yet been defined */
663                         nowrites = 1;
664                         if (dur_secs == 0 && dur_txg == 0)
665                                 record.zi_duration = 30;
666                         break;
667                 case 'l':
668                         level = (int)strtol(optarg, &end, 10);
669                         if (*end != '\0') {
670                                 (void) fprintf(stderr, "invalid level '%s': "
671                                     "must be an integer\n", optarg);
672                                 usage();
673                                 return (1);
674                         }
675                         break;
676                 case 'm':
677                         domount = 1;
678                         break;
679                 case 'p':
680                         (void) strlcpy(record.zi_func, optarg,
681                             sizeof (record.zi_func));
682                         break;
683                 case 'q':
684                         quiet = 1;
685                         break;
686                 case 'r':
687                         range = optarg;
688                         break;
689                 case 's':
690                         dur_secs = 1;
691                         record.zi_duration = (int)strtol(optarg, &end, 10);
692                         if (record.zi_duration <= 0 || *end != '\0') {
693                                 (void) fprintf(stderr, "invalid duration '%s': "
694                                     "must be a positive integer\n", optarg);
695                                 usage();
696                                 return (1);
697                         }
698                         break;
699                 case 'T':
700                         if (strcasecmp(optarg, "read") == 0) {
701                                 io_type = ZIO_TYPE_READ;
702                         } else if (strcasecmp(optarg, "write") == 0) {
703                                 io_type = ZIO_TYPE_WRITE;
704                         } else if (strcasecmp(optarg, "free") == 0) {
705                                 io_type = ZIO_TYPE_FREE;
706                         } else if (strcasecmp(optarg, "claim") == 0) {
707                                 io_type = ZIO_TYPE_CLAIM;
708                         } else if (strcasecmp(optarg, "all") == 0) {
709                                 io_type = ZIO_TYPES;
710                         } else {
711                                 (void) fprintf(stderr, "invalid I/O type "
712                                     "'%s': must be 'read', 'write', 'free', "
713                                     "'claim' or 'all'\n", optarg);
714                                 usage();
715                                 return (1);
716                         }
717                         break;
718                 case 't':
719                         if ((type = name_to_type(optarg)) == TYPE_INVAL &&
720                             !MOS_TYPE(type)) {
721                                 (void) fprintf(stderr, "invalid type '%s'\n",
722                                     optarg);
723                                 usage();
724                                 return (1);
725                         }
726                         break;
727                 case 'u':
728                         flags |= ZINJECT_UNLOAD_SPA;
729                         break;
730                 case 'L':
731                         if ((label = name_to_type(optarg)) == TYPE_INVAL &&
732                             !LABEL_TYPE(type)) {
733                                 (void) fprintf(stderr, "invalid label type "
734                                     "'%s'\n", optarg);
735                                 usage();
736                                 return (1);
737                         }
738                         break;
739                 case ':':
740                         (void) fprintf(stderr, "option -%c requires an "
741                             "operand\n", optopt);
742                         usage();
743                         return (1);
744                 case '?':
745                         (void) fprintf(stderr, "invalid option '%c'\n",
746                             optopt);
747                         usage();
748                         return (2);
749                 }
750         }
751
752         argc -= optind;
753         argv += optind;
754
755         if ((g_zfs = libzfs_init()) == NULL)
756                 return (1);
757
758         libzfs_print_on_error(g_zfs, B_TRUE);
759
760         if ((zfs_fd = open(ZFS_DEV, O_RDWR)) < 0) {
761                 (void) fprintf(stderr, "failed to open ZFS device\n");
762                 return (1);
763         }
764
765         if (cancel != NULL) {
766                 /*
767                  * '-c' is invalid with any other options.
768                  */
769                 if (raw != NULL || range != NULL || type != TYPE_INVAL ||
770                     level != 0 || record.zi_func[0] != '\0' ||
771                     record.zi_duration != 0) {
772                         (void) fprintf(stderr, "cancel (-c) incompatible with "
773                             "any other options\n");
774                         usage();
775                         return (2);
776                 }
777                 if (argc != 0) {
778                         (void) fprintf(stderr, "extraneous argument to '-c'\n");
779                         usage();
780                         return (2);
781                 }
782
783                 if (strcmp(cancel, "all") == 0) {
784                         return (cancel_all_handlers());
785                 } else {
786                         int id = (int)strtol(cancel, &end, 10);
787                         if (*end != '\0') {
788                                 (void) fprintf(stderr, "invalid handle id '%s':"
789                                     " must be an integer or 'all'\n", cancel);
790                                 usage();
791                                 return (1);
792                         }
793                         return (cancel_handler(id));
794                 }
795         }
796
797         if (device != NULL) {
798                 /*
799                  * Device (-d) injection uses a completely different mechanism
800                  * for doing injection, so handle it separately here.
801                  */
802                 if (raw != NULL || range != NULL || type != TYPE_INVAL ||
803                     level != 0 || record.zi_func[0] != '\0' ||
804                     record.zi_duration != 0) {
805                         (void) fprintf(stderr, "device (-d) incompatible with "
806                             "data error injection\n");
807                         usage();
808                         return (2);
809                 }
810
811                 if (argc != 1) {
812                         (void) fprintf(stderr, "device (-d) injection requires "
813                             "a single pool name\n");
814                         usage();
815                         return (2);
816                 }
817
818                 (void) strcpy(pool, argv[0]);
819                 dataset[0] = '\0';
820
821                 if (error == ECKSUM) {
822                         (void) fprintf(stderr, "device error type must be "
823                             "'io' or 'nxio'\n");
824                         return (1);
825                 }
826
827                 record.zi_iotype = io_type;
828                 if (translate_device(pool, device, label, &record) != 0)
829                         return (1);
830                 if (!error)
831                         error = ENXIO;
832
833                 if (action != VDEV_STATE_UNKNOWN)
834                         return (perform_action(pool, &record, action));
835
836         } else if (raw != NULL) {
837                 if (range != NULL || type != TYPE_INVAL || level != 0 ||
838                     record.zi_func[0] != '\0' || record.zi_duration != 0) {
839                         (void) fprintf(stderr, "raw (-b) format with "
840                             "any other options\n");
841                         usage();
842                         return (2);
843                 }
844
845                 if (argc != 1) {
846                         (void) fprintf(stderr, "raw (-b) format expects a "
847                             "single pool name\n");
848                         usage();
849                         return (2);
850                 }
851
852                 (void) strcpy(pool, argv[0]);
853                 dataset[0] = '\0';
854
855                 if (error == ENXIO) {
856                         (void) fprintf(stderr, "data error type must be "
857                             "'checksum' or 'io'\n");
858                         return (1);
859                 }
860
861                 if (translate_raw(raw, &record) != 0)
862                         return (1);
863                 if (!error)
864                         error = EIO;
865         } else if (record.zi_func[0] != '\0') {
866                 if (raw != NULL || range != NULL || type != TYPE_INVAL ||
867                     level != 0 || device != NULL || record.zi_duration != 0) {
868                         (void) fprintf(stderr, "panic (-p) incompatible with "
869                             "other options\n");
870                         usage();
871                         return (2);
872                 }
873
874                 if (argc < 1 || argc > 2) {
875                         (void) fprintf(stderr, "panic (-p) injection requires "
876                             "a single pool name and an optional id\n");
877                         usage();
878                         return (2);
879                 }
880
881                 (void) strcpy(pool, argv[0]);
882                 if (argv[1] != NULL)
883                         record.zi_type = atoi(argv[1]);
884                 dataset[0] = '\0';
885         } else if (record.zi_duration != 0) {
886                 if (nowrites == 0) {
887                         (void) fprintf(stderr, "-s or -g meaningless "
888                             "without -I (ignore writes)\n");
889                         usage();
890                         return (2);
891                 } else if (dur_secs && dur_txg) {
892                         (void) fprintf(stderr, "choose a duration either "
893                             "in seconds (-s) or a number of txgs (-g) "
894                             "but not both\n");
895                         usage();
896                         return (2);
897                 } else if (argc != 1) {
898                         (void) fprintf(stderr, "ignore writes (-I) "
899                             "injection requires a single pool name\n");
900                         usage();
901                         return (2);
902                 }
903
904                 (void) strcpy(pool, argv[0]);
905                 dataset[0] = '\0';
906         } else if (type == TYPE_INVAL) {
907                 if (flags == 0) {
908                         (void) fprintf(stderr, "at least one of '-b', '-d', "
909                             "'-t', '-a', '-p', '-I' or '-u' "
910                             "must be specified\n");
911                         usage();
912                         return (2);
913                 }
914
915                 if (argc == 1 && (flags & ZINJECT_UNLOAD_SPA)) {
916                         (void) strcpy(pool, argv[0]);
917                         dataset[0] = '\0';
918                 } else if (argc != 0) {
919                         (void) fprintf(stderr, "extraneous argument for "
920                             "'-f'\n");
921                         usage();
922                         return (2);
923                 }
924
925                 flags |= ZINJECT_NULL;
926         } else {
927                 if (argc != 1) {
928                         (void) fprintf(stderr, "missing object\n");
929                         usage();
930                         return (2);
931                 }
932
933                 if (error == ENXIO) {
934                         (void) fprintf(stderr, "data error type must be "
935                             "'checksum' or 'io'\n");
936                         return (1);
937                 }
938
939                 if (translate_record(type, argv[0], range, level, &record, pool,
940                     dataset) != 0)
941                         return (1);
942                 if (!error)
943                         error = EIO;
944         }
945
946         /*
947          * If this is pool-wide metadata, unmount everything.  The ioctl() will
948          * unload the pool, so that we trigger spa-wide reopen of metadata next
949          * time we access the pool.
950          */
951         if (dataset[0] != '\0' && domount) {
952                 if ((zhp = zfs_open(g_zfs, dataset, ZFS_TYPE_DATASET)) == NULL)
953                         return (1);
954                 if (zfs_unmount(zhp, NULL, 0) != 0)
955                         return (1);
956         }
957
958         record.zi_error = error;
959
960         ret = register_handler(pool, flags, &record, quiet);
961
962         if (dataset[0] != '\0' && domount)
963                 ret = (zfs_mount(zhp, NULL, 0) != 0);
964
965         libzfs_fini(g_zfs);
966
967         return (ret);
968 }