Move the world out of /zfs/ and seperate out module build tree
[zfs.git] / module / zfs / zfs_ioctl.c
1 /*
2  * CDDL HEADER START
3  *
4  * The contents of this file are subject to the terms of the
5  * Common Development and Distribution License (the "License").
6  * You may not use this file except in compliance with the License.
7  *
8  * You can obtain a copy of the license at usr/src/OPENSOLARIS.LICENSE
9  * or http://www.opensolaris.org/os/licensing.
10  * See the License for the specific language governing permissions
11  * and limitations under the License.
12  *
13  * When distributing Covered Code, include this CDDL HEADER in each
14  * file and include the License file at usr/src/OPENSOLARIS.LICENSE.
15  * If applicable, add the following below this CDDL HEADER, with the
16  * fields enclosed by brackets "[]" replaced with your own identifying
17  * information: Portions Copyright [yyyy] [name of copyright owner]
18  *
19  * CDDL HEADER END
20  */
21 /*
22  * Copyright 2008 Sun Microsystems, Inc.  All rights reserved.
23  * Use is subject to license terms.
24  */
25
26 #include <sys/types.h>
27 #include <sys/param.h>
28 #include <sys/errno.h>
29 #include <sys/uio.h>
30 #include <sys/buf.h>
31 #include <sys/modctl.h>
32 #include <sys/open.h>
33 #include <sys/file.h>
34 #include <sys/kmem.h>
35 #include <sys/conf.h>
36 #include <sys/cmn_err.h>
37 #include <sys/stat.h>
38 #include <sys/zfs_ioctl.h>
39 #include <sys/zfs_znode.h>
40 #include <sys/zap.h>
41 #include <sys/spa.h>
42 #include <sys/spa_impl.h>
43 #include <sys/vdev.h>
44 #include <sys/vdev_impl.h>
45 #include <sys/dmu.h>
46 #include <sys/dsl_dir.h>
47 #include <sys/dsl_dataset.h>
48 #include <sys/dsl_prop.h>
49 #include <sys/dsl_deleg.h>
50 #include <sys/dmu_objset.h>
51 #include <sys/ddi.h>
52 #include <sys/sunddi.h>
53 #include <sys/sunldi.h>
54 #include <sys/policy.h>
55 #include <sys/zone.h>
56 #include <sys/nvpair.h>
57 #include <sys/pathname.h>
58 #include <sys/mount.h>
59 #include <sys/sdt.h>
60 #include <sys/fs/zfs.h>
61 #include <sys/zfs_ctldir.h>
62 #include <sys/zfs_dir.h>
63 #include <sys/zvol.h>
64 #include <sharefs/share.h>
65 #include <sys/dmu_objset.h>
66
67 #include "zfs_namecheck.h"
68 #include "zfs_prop.h"
69 #include "zfs_deleg.h"
70
71 extern struct modlfs zfs_modlfs;
72
73 extern void zfs_init(void);
74 extern void zfs_fini(void);
75
76 ldi_ident_t zfs_li = NULL;
77 dev_info_t *zfs_dip;
78
79 typedef int zfs_ioc_func_t(zfs_cmd_t *);
80 typedef int zfs_secpolicy_func_t(zfs_cmd_t *, cred_t *);
81
82 typedef struct zfs_ioc_vec {
83         zfs_ioc_func_t          *zvec_func;
84         zfs_secpolicy_func_t    *zvec_secpolicy;
85         enum {
86                 NO_NAME,
87                 POOL_NAME,
88                 DATASET_NAME
89         } zvec_namecheck;
90         boolean_t               zvec_his_log;
91 } zfs_ioc_vec_t;
92
93 static void clear_props(char *dataset, nvlist_t *props);
94 static int zfs_fill_zplprops_root(uint64_t, nvlist_t *, nvlist_t *,
95     boolean_t *);
96 int zfs_set_prop_nvlist(const char *, nvlist_t *);
97
98 /* _NOTE(PRINTFLIKE(4)) - this is printf-like, but lint is too whiney */
99 void
100 __dprintf(const char *file, const char *func, int line, const char *fmt, ...)
101 {
102         const char *newfile;
103         char buf[256];
104         va_list adx;
105
106         /*
107          * Get rid of annoying "../common/" prefix to filename.
108          */
109         newfile = strrchr(file, '/');
110         if (newfile != NULL) {
111                 newfile = newfile + 1; /* Get rid of leading / */
112         } else {
113                 newfile = file;
114         }
115
116         va_start(adx, fmt);
117         (void) vsnprintf(buf, sizeof (buf), fmt, adx);
118         va_end(adx);
119
120         /*
121          * To get this data, use the zfs-dprintf probe as so:
122          * dtrace -q -n 'zfs-dprintf \
123          *      /stringof(arg0) == "dbuf.c"/ \
124          *      {printf("%s: %s", stringof(arg1), stringof(arg3))}'
125          * arg0 = file name
126          * arg1 = function name
127          * arg2 = line number
128          * arg3 = message
129          */
130         DTRACE_PROBE4(zfs__dprintf,
131             char *, newfile, char *, func, int, line, char *, buf);
132 }
133
134 static void
135 history_str_free(char *buf)
136 {
137         kmem_free(buf, HIS_MAX_RECORD_LEN);
138 }
139
140 static char *
141 history_str_get(zfs_cmd_t *zc)
142 {
143         char *buf;
144
145         if (zc->zc_history == NULL)
146                 return (NULL);
147
148         buf = kmem_alloc(HIS_MAX_RECORD_LEN, KM_SLEEP);
149         if (copyinstr((void *)(uintptr_t)zc->zc_history,
150             buf, HIS_MAX_RECORD_LEN, NULL) != 0) {
151                 history_str_free(buf);
152                 return (NULL);
153         }
154
155         buf[HIS_MAX_RECORD_LEN -1] = '\0';
156
157         return (buf);
158 }
159
160 /*
161  * Check to see if the named dataset is currently defined as bootable
162  */
163 static boolean_t
164 zfs_is_bootfs(const char *name)
165 {
166         spa_t *spa;
167         boolean_t ret = B_FALSE;
168
169         if (spa_open(name, &spa, FTAG) == 0) {
170                 if (spa->spa_bootfs) {
171                         objset_t *os;
172
173                         if (dmu_objset_open(name, DMU_OST_ZFS,
174                             DS_MODE_USER | DS_MODE_READONLY, &os) == 0) {
175                                 ret = (dmu_objset_id(os) == spa->spa_bootfs);
176                                 dmu_objset_close(os);
177                         }
178                 }
179                 spa_close(spa, FTAG);
180         }
181         return (ret);
182 }
183
184 /*
185  * zfs_earlier_version
186  *
187  *      Return non-zero if the spa version is less than requested version.
188  */
189 static int
190 zfs_earlier_version(const char *name, int version)
191 {
192         spa_t *spa;
193
194         if (spa_open(name, &spa, FTAG) == 0) {
195                 if (spa_version(spa) < version) {
196                         spa_close(spa, FTAG);
197                         return (1);
198                 }
199                 spa_close(spa, FTAG);
200         }
201         return (0);
202 }
203
204 /*
205  * zpl_earlier_version
206  *
207  * Return TRUE if the ZPL version is less than requested version.
208  */
209 static boolean_t
210 zpl_earlier_version(const char *name, int version)
211 {
212         objset_t *os;
213         boolean_t rc = B_TRUE;
214
215         if (dmu_objset_open(name, DMU_OST_ANY,
216             DS_MODE_USER | DS_MODE_READONLY, &os) == 0) {
217                 uint64_t zplversion;
218
219                 if (zfs_get_zplprop(os, ZFS_PROP_VERSION, &zplversion) == 0)
220                         rc = zplversion < version;
221                 dmu_objset_close(os);
222         }
223         return (rc);
224 }
225
226 static void
227 zfs_log_history(zfs_cmd_t *zc)
228 {
229         spa_t *spa;
230         char *buf;
231
232         if ((buf = history_str_get(zc)) == NULL)
233                 return;
234
235         if (spa_open(zc->zc_name, &spa, FTAG) == 0) {
236                 if (spa_version(spa) >= SPA_VERSION_ZPOOL_HISTORY)
237                         (void) spa_history_log(spa, buf, LOG_CMD_NORMAL);
238                 spa_close(spa, FTAG);
239         }
240         history_str_free(buf);
241 }
242
243 /*
244  * Policy for top-level read operations (list pools).  Requires no privileges,
245  * and can be used in the local zone, as there is no associated dataset.
246  */
247 /* ARGSUSED */
248 static int
249 zfs_secpolicy_none(zfs_cmd_t *zc, cred_t *cr)
250 {
251         return (0);
252 }
253
254 /*
255  * Policy for dataset read operations (list children, get statistics).  Requires
256  * no privileges, but must be visible in the local zone.
257  */
258 /* ARGSUSED */
259 static int
260 zfs_secpolicy_read(zfs_cmd_t *zc, cred_t *cr)
261 {
262         if (INGLOBALZONE(curproc) ||
263             zone_dataset_visible(zc->zc_name, NULL))
264                 return (0);
265
266         return (ENOENT);
267 }
268
269 static int
270 zfs_dozonecheck(const char *dataset, cred_t *cr)
271 {
272         uint64_t zoned;
273         int writable = 1;
274
275         /*
276          * The dataset must be visible by this zone -- check this first
277          * so they don't see EPERM on something they shouldn't know about.
278          */
279         if (!INGLOBALZONE(curproc) &&
280             !zone_dataset_visible(dataset, &writable))
281                 return (ENOENT);
282
283         if (dsl_prop_get_integer(dataset, "zoned", &zoned, NULL))
284                 return (ENOENT);
285
286         if (INGLOBALZONE(curproc)) {
287                 /*
288                  * If the fs is zoned, only root can access it from the
289                  * global zone.
290                  */
291                 if (secpolicy_zfs(cr) && zoned)
292                         return (EPERM);
293         } else {
294                 /*
295                  * If we are in a local zone, the 'zoned' property must be set.
296                  */
297                 if (!zoned)
298                         return (EPERM);
299
300                 /* must be writable by this zone */
301                 if (!writable)
302                         return (EPERM);
303         }
304         return (0);
305 }
306
307 int
308 zfs_secpolicy_write_perms(const char *name, const char *perm, cred_t *cr)
309 {
310         int error;
311
312         error = zfs_dozonecheck(name, cr);
313         if (error == 0) {
314                 error = secpolicy_zfs(cr);
315                 if (error)
316                         error = dsl_deleg_access(name, perm, cr);
317         }
318         return (error);
319 }
320
321 static int
322 zfs_secpolicy_setprop(const char *name, zfs_prop_t prop, cred_t *cr)
323 {
324         /*
325          * Check permissions for special properties.
326          */
327         switch (prop) {
328         case ZFS_PROP_ZONED:
329                 /*
330                  * Disallow setting of 'zoned' from within a local zone.
331                  */
332                 if (!INGLOBALZONE(curproc))
333                         return (EPERM);
334                 break;
335
336         case ZFS_PROP_QUOTA:
337                 if (!INGLOBALZONE(curproc)) {
338                         uint64_t zoned;
339                         char setpoint[MAXNAMELEN];
340                         /*
341                          * Unprivileged users are allowed to modify the
342                          * quota on things *under* (ie. contained by)
343                          * the thing they own.
344                          */
345                         if (dsl_prop_get_integer(name, "zoned", &zoned,
346                             setpoint))
347                                 return (EPERM);
348                         if (!zoned || strlen(name) <= strlen(setpoint))
349                                 return (EPERM);
350                 }
351                 break;
352         }
353
354         return (zfs_secpolicy_write_perms(name, zfs_prop_to_name(prop), cr));
355 }
356
357 int
358 zfs_secpolicy_fsacl(zfs_cmd_t *zc, cred_t *cr)
359 {
360         int error;
361
362         error = zfs_dozonecheck(zc->zc_name, cr);
363         if (error)
364                 return (error);
365
366         /*
367          * permission to set permissions will be evaluated later in
368          * dsl_deleg_can_allow()
369          */
370         return (0);
371 }
372
373 int
374 zfs_secpolicy_rollback(zfs_cmd_t *zc, cred_t *cr)
375 {
376         int error;
377         error = zfs_secpolicy_write_perms(zc->zc_name,
378             ZFS_DELEG_PERM_ROLLBACK, cr);
379         if (error == 0)
380                 error = zfs_secpolicy_write_perms(zc->zc_name,
381                     ZFS_DELEG_PERM_MOUNT, cr);
382         return (error);
383 }
384
385 int
386 zfs_secpolicy_send(zfs_cmd_t *zc, cred_t *cr)
387 {
388         return (zfs_secpolicy_write_perms(zc->zc_name,
389             ZFS_DELEG_PERM_SEND, cr));
390 }
391
392 int
393 zfs_secpolicy_share(zfs_cmd_t *zc, cred_t *cr)
394 {
395         if (!INGLOBALZONE(curproc))
396                 return (EPERM);
397
398         if (secpolicy_nfs(cr) == 0) {
399                 return (0);
400         } else {
401                 vnode_t *vp;
402                 int error;
403
404                 if ((error = lookupname(zc->zc_value, UIO_SYSSPACE,
405                     NO_FOLLOW, NULL, &vp)) != 0)
406                         return (error);
407
408                 /* Now make sure mntpnt and dataset are ZFS */
409
410                 if (vp->v_vfsp->vfs_fstype != zfsfstype ||
411                     (strcmp((char *)refstr_value(vp->v_vfsp->vfs_resource),
412                     zc->zc_name) != 0)) {
413                         VN_RELE(vp);
414                         return (EPERM);
415                 }
416
417                 VN_RELE(vp);
418                 return (dsl_deleg_access(zc->zc_name,
419                     ZFS_DELEG_PERM_SHARE, cr));
420         }
421 }
422
423 static int
424 zfs_get_parent(const char *datasetname, char *parent, int parentsize)
425 {
426         char *cp;
427
428         /*
429          * Remove the @bla or /bla from the end of the name to get the parent.
430          */
431         (void) strncpy(parent, datasetname, parentsize);
432         cp = strrchr(parent, '@');
433         if (cp != NULL) {
434                 cp[0] = '\0';
435         } else {
436                 cp = strrchr(parent, '/');
437                 if (cp == NULL)
438                         return (ENOENT);
439                 cp[0] = '\0';
440         }
441
442         return (0);
443 }
444
445 int
446 zfs_secpolicy_destroy_perms(const char *name, cred_t *cr)
447 {
448         int error;
449
450         if ((error = zfs_secpolicy_write_perms(name,
451             ZFS_DELEG_PERM_MOUNT, cr)) != 0)
452                 return (error);
453
454         return (zfs_secpolicy_write_perms(name, ZFS_DELEG_PERM_DESTROY, cr));
455 }
456
457 static int
458 zfs_secpolicy_destroy(zfs_cmd_t *zc, cred_t *cr)
459 {
460         return (zfs_secpolicy_destroy_perms(zc->zc_name, cr));
461 }
462
463 /*
464  * Must have sys_config privilege to check the iscsi permission
465  */
466 /* ARGSUSED */
467 static int
468 zfs_secpolicy_iscsi(zfs_cmd_t *zc, cred_t *cr)
469 {
470         return (secpolicy_zfs(cr));
471 }
472
473 int
474 zfs_secpolicy_rename_perms(const char *from, const char *to, cred_t *cr)
475 {
476         char    parentname[MAXNAMELEN];
477         int     error;
478
479         if ((error = zfs_secpolicy_write_perms(from,
480             ZFS_DELEG_PERM_RENAME, cr)) != 0)
481                 return (error);
482
483         if ((error = zfs_secpolicy_write_perms(from,
484             ZFS_DELEG_PERM_MOUNT, cr)) != 0)
485                 return (error);
486
487         if ((error = zfs_get_parent(to, parentname,
488             sizeof (parentname))) != 0)
489                 return (error);
490
491         if ((error = zfs_secpolicy_write_perms(parentname,
492             ZFS_DELEG_PERM_CREATE, cr)) != 0)
493                 return (error);
494
495         if ((error = zfs_secpolicy_write_perms(parentname,
496             ZFS_DELEG_PERM_MOUNT, cr)) != 0)
497                 return (error);
498
499         return (error);
500 }
501
502 static int
503 zfs_secpolicy_rename(zfs_cmd_t *zc, cred_t *cr)
504 {
505         return (zfs_secpolicy_rename_perms(zc->zc_name, zc->zc_value, cr));
506 }
507
508 static int
509 zfs_secpolicy_promote(zfs_cmd_t *zc, cred_t *cr)
510 {
511         char    parentname[MAXNAMELEN];
512         objset_t *clone;
513         int error;
514
515         error = zfs_secpolicy_write_perms(zc->zc_name,
516             ZFS_DELEG_PERM_PROMOTE, cr);
517         if (error)
518                 return (error);
519
520         error = dmu_objset_open(zc->zc_name, DMU_OST_ANY,
521             DS_MODE_USER | DS_MODE_READONLY, &clone);
522
523         if (error == 0) {
524                 dsl_dataset_t *pclone = NULL;
525                 dsl_dir_t *dd;
526                 dd = clone->os->os_dsl_dataset->ds_dir;
527
528                 rw_enter(&dd->dd_pool->dp_config_rwlock, RW_READER);
529                 error = dsl_dataset_hold_obj(dd->dd_pool,
530                     dd->dd_phys->dd_origin_obj, FTAG, &pclone);
531                 rw_exit(&dd->dd_pool->dp_config_rwlock);
532                 if (error) {
533                         dmu_objset_close(clone);
534                         return (error);
535                 }
536
537                 error = zfs_secpolicy_write_perms(zc->zc_name,
538                     ZFS_DELEG_PERM_MOUNT, cr);
539
540                 dsl_dataset_name(pclone, parentname);
541                 dmu_objset_close(clone);
542                 dsl_dataset_rele(pclone, FTAG);
543                 if (error == 0)
544                         error = zfs_secpolicy_write_perms(parentname,
545                             ZFS_DELEG_PERM_PROMOTE, cr);
546         }
547         return (error);
548 }
549
550 static int
551 zfs_secpolicy_receive(zfs_cmd_t *zc, cred_t *cr)
552 {
553         int error;
554
555         if ((error = zfs_secpolicy_write_perms(zc->zc_name,
556             ZFS_DELEG_PERM_RECEIVE, cr)) != 0)
557                 return (error);
558
559         if ((error = zfs_secpolicy_write_perms(zc->zc_name,
560             ZFS_DELEG_PERM_MOUNT, cr)) != 0)
561                 return (error);
562
563         return (zfs_secpolicy_write_perms(zc->zc_name,
564             ZFS_DELEG_PERM_CREATE, cr));
565 }
566
567 int
568 zfs_secpolicy_snapshot_perms(const char *name, cred_t *cr)
569 {
570         int error;
571
572         if ((error = zfs_secpolicy_write_perms(name,
573             ZFS_DELEG_PERM_SNAPSHOT, cr)) != 0)
574                 return (error);
575
576         error = zfs_secpolicy_write_perms(name,
577             ZFS_DELEG_PERM_MOUNT, cr);
578
579         return (error);
580 }
581
582 static int
583 zfs_secpolicy_snapshot(zfs_cmd_t *zc, cred_t *cr)
584 {
585
586         return (zfs_secpolicy_snapshot_perms(zc->zc_name, cr));
587 }
588
589 static int
590 zfs_secpolicy_create(zfs_cmd_t *zc, cred_t *cr)
591 {
592         char    parentname[MAXNAMELEN];
593         int     error;
594
595         if ((error = zfs_get_parent(zc->zc_name, parentname,
596             sizeof (parentname))) != 0)
597                 return (error);
598
599         if (zc->zc_value[0] != '\0') {
600                 if ((error = zfs_secpolicy_write_perms(zc->zc_value,
601                     ZFS_DELEG_PERM_CLONE, cr)) != 0)
602                         return (error);
603         }
604
605         if ((error = zfs_secpolicy_write_perms(parentname,
606             ZFS_DELEG_PERM_CREATE, cr)) != 0)
607                 return (error);
608
609         error = zfs_secpolicy_write_perms(parentname,
610             ZFS_DELEG_PERM_MOUNT, cr);
611
612         return (error);
613 }
614
615 static int
616 zfs_secpolicy_umount(zfs_cmd_t *zc, cred_t *cr)
617 {
618         int error;
619
620         error = secpolicy_fs_unmount(cr, NULL);
621         if (error) {
622                 error = dsl_deleg_access(zc->zc_name, ZFS_DELEG_PERM_MOUNT, cr);
623         }
624         return (error);
625 }
626
627 /*
628  * Policy for pool operations - create/destroy pools, add vdevs, etc.  Requires
629  * SYS_CONFIG privilege, which is not available in a local zone.
630  */
631 /* ARGSUSED */
632 static int
633 zfs_secpolicy_config(zfs_cmd_t *zc, cred_t *cr)
634 {
635         if (secpolicy_sys_config(cr, B_FALSE) != 0)
636                 return (EPERM);
637
638         return (0);
639 }
640
641 /*
642  * Just like zfs_secpolicy_config, except that we will check for
643  * mount permission on the dataset for permission to create/remove
644  * the minor nodes.
645  */
646 static int
647 zfs_secpolicy_minor(zfs_cmd_t *zc, cred_t *cr)
648 {
649         if (secpolicy_sys_config(cr, B_FALSE) != 0) {
650                 return (dsl_deleg_access(zc->zc_name,
651                     ZFS_DELEG_PERM_MOUNT, cr));
652         }
653
654         return (0);
655 }
656
657 /*
658  * Policy for fault injection.  Requires all privileges.
659  */
660 /* ARGSUSED */
661 static int
662 zfs_secpolicy_inject(zfs_cmd_t *zc, cred_t *cr)
663 {
664         return (secpolicy_zinject(cr));
665 }
666
667 static int
668 zfs_secpolicy_inherit(zfs_cmd_t *zc, cred_t *cr)
669 {
670         zfs_prop_t prop = zfs_name_to_prop(zc->zc_value);
671
672         if (prop == ZPROP_INVAL) {
673                 if (!zfs_prop_user(zc->zc_value))
674                         return (EINVAL);
675                 return (zfs_secpolicy_write_perms(zc->zc_name,
676                     ZFS_DELEG_PERM_USERPROP, cr));
677         } else {
678                 if (!zfs_prop_inheritable(prop))
679                         return (EINVAL);
680                 return (zfs_secpolicy_setprop(zc->zc_name, prop, cr));
681         }
682 }
683
684 /*
685  * Returns the nvlist as specified by the user in the zfs_cmd_t.
686  */
687 static int
688 get_nvlist(uint64_t nvl, uint64_t size, nvlist_t **nvp)
689 {
690         char *packed;
691         int error;
692         nvlist_t *list = NULL;
693
694         /*
695          * Read in and unpack the user-supplied nvlist.
696          */
697         if (size == 0)
698                 return (EINVAL);
699
700         packed = kmem_alloc(size, KM_SLEEP);
701
702         if ((error = xcopyin((void *)(uintptr_t)nvl, packed, size)) != 0) {
703                 kmem_free(packed, size);
704                 return (error);
705         }
706
707         if ((error = nvlist_unpack(packed, size, &list, 0)) != 0) {
708                 kmem_free(packed, size);
709                 return (error);
710         }
711
712         kmem_free(packed, size);
713
714         *nvp = list;
715         return (0);
716 }
717
718 static int
719 put_nvlist(zfs_cmd_t *zc, nvlist_t *nvl)
720 {
721         char *packed = NULL;
722         size_t size;
723         int error;
724
725         VERIFY(nvlist_size(nvl, &size, NV_ENCODE_NATIVE) == 0);
726
727         if (size > zc->zc_nvlist_dst_size) {
728                 error = ENOMEM;
729         } else {
730                 packed = kmem_alloc(size, KM_SLEEP);
731                 VERIFY(nvlist_pack(nvl, &packed, &size, NV_ENCODE_NATIVE,
732                     KM_SLEEP) == 0);
733                 error = xcopyout(packed, (void *)(uintptr_t)zc->zc_nvlist_dst,
734                     size);
735                 kmem_free(packed, size);
736         }
737
738         zc->zc_nvlist_dst_size = size;
739         return (error);
740 }
741
742 static int
743 zfs_ioc_pool_create(zfs_cmd_t *zc)
744 {
745         int error;
746         nvlist_t *config, *props = NULL;
747         nvlist_t *rootprops = NULL;
748         nvlist_t *zplprops = NULL;
749         char *buf;
750
751         if (error = get_nvlist(zc->zc_nvlist_conf, zc->zc_nvlist_conf_size,
752             &config))
753                 return (error);
754
755         if (zc->zc_nvlist_src_size != 0 && (error =
756             get_nvlist(zc->zc_nvlist_src, zc->zc_nvlist_src_size, &props))) {
757                 nvlist_free(config);
758                 return (error);
759         }
760
761         if (props) {
762                 nvlist_t *nvl = NULL;
763                 uint64_t version = SPA_VERSION;
764
765                 (void) nvlist_lookup_uint64(props,
766                     zpool_prop_to_name(ZPOOL_PROP_VERSION), &version);
767                 if (version < SPA_VERSION_INITIAL || version > SPA_VERSION) {
768                         error = EINVAL;
769                         goto pool_props_bad;
770                 }
771                 (void) nvlist_lookup_nvlist(props, ZPOOL_ROOTFS_PROPS, &nvl);
772                 if (nvl) {
773                         error = nvlist_dup(nvl, &rootprops, KM_SLEEP);
774                         if (error != 0) {
775                                 nvlist_free(config);
776                                 nvlist_free(props);
777                                 return (error);
778                         }
779                         (void) nvlist_remove_all(props, ZPOOL_ROOTFS_PROPS);
780                 }
781                 VERIFY(nvlist_alloc(&zplprops, NV_UNIQUE_NAME, KM_SLEEP) == 0);
782                 error = zfs_fill_zplprops_root(version, rootprops,
783                     zplprops, NULL);
784                 if (error)
785                         goto pool_props_bad;
786         }
787
788         buf = history_str_get(zc);
789
790         error = spa_create(zc->zc_name, config, props, buf, zplprops);
791
792         /*
793          * Set the remaining root properties
794          */
795         if (!error &&
796             (error = zfs_set_prop_nvlist(zc->zc_name, rootprops)) != 0)
797                 (void) spa_destroy(zc->zc_name);
798
799         if (buf != NULL)
800                 history_str_free(buf);
801
802 pool_props_bad:
803         nvlist_free(rootprops);
804         nvlist_free(zplprops);
805         nvlist_free(config);
806         nvlist_free(props);
807
808         return (error);
809 }
810
811 static int
812 zfs_ioc_pool_destroy(zfs_cmd_t *zc)
813 {
814         int error;
815         zfs_log_history(zc);
816         error = spa_destroy(zc->zc_name);
817         return (error);
818 }
819
820 static int
821 zfs_ioc_pool_import(zfs_cmd_t *zc)
822 {
823         int error;
824         nvlist_t *config, *props = NULL;
825         uint64_t guid;
826
827         if ((error = get_nvlist(zc->zc_nvlist_conf, zc->zc_nvlist_conf_size,
828             &config)) != 0)
829                 return (error);
830
831         if (zc->zc_nvlist_src_size != 0 && (error =
832             get_nvlist(zc->zc_nvlist_src, zc->zc_nvlist_src_size, &props))) {
833                 nvlist_free(config);
834                 return (error);
835         }
836
837         if (nvlist_lookup_uint64(config, ZPOOL_CONFIG_POOL_GUID, &guid) != 0 ||
838             guid != zc->zc_guid)
839                 error = EINVAL;
840         else if (zc->zc_cookie)
841                 error = spa_import_faulted(zc->zc_name, config,
842                     props);
843         else
844                 error = spa_import(zc->zc_name, config, props);
845
846         nvlist_free(config);
847
848         if (props)
849                 nvlist_free(props);
850
851         return (error);
852 }
853
854 static int
855 zfs_ioc_pool_export(zfs_cmd_t *zc)
856 {
857         int error;
858         boolean_t force = (boolean_t)zc->zc_cookie;
859
860         zfs_log_history(zc);
861         error = spa_export(zc->zc_name, NULL, force);
862         return (error);
863 }
864
865 static int
866 zfs_ioc_pool_configs(zfs_cmd_t *zc)
867 {
868         nvlist_t *configs;
869         int error;
870
871         if ((configs = spa_all_configs(&zc->zc_cookie)) == NULL)
872                 return (EEXIST);
873
874         error = put_nvlist(zc, configs);
875
876         nvlist_free(configs);
877
878         return (error);
879 }
880
881 static int
882 zfs_ioc_pool_stats(zfs_cmd_t *zc)
883 {
884         nvlist_t *config;
885         int error;
886         int ret = 0;
887
888         error = spa_get_stats(zc->zc_name, &config, zc->zc_value,
889             sizeof (zc->zc_value));
890
891         if (config != NULL) {
892                 ret = put_nvlist(zc, config);
893                 nvlist_free(config);
894
895                 /*
896                  * The config may be present even if 'error' is non-zero.
897                  * In this case we return success, and preserve the real errno
898                  * in 'zc_cookie'.
899                  */
900                 zc->zc_cookie = error;
901         } else {
902                 ret = error;
903         }
904
905         return (ret);
906 }
907
908 /*
909  * Try to import the given pool, returning pool stats as appropriate so that
910  * user land knows which devices are available and overall pool health.
911  */
912 static int
913 zfs_ioc_pool_tryimport(zfs_cmd_t *zc)
914 {
915         nvlist_t *tryconfig, *config;
916         int error;
917
918         if ((error = get_nvlist(zc->zc_nvlist_conf, zc->zc_nvlist_conf_size,
919             &tryconfig)) != 0)
920                 return (error);
921
922         config = spa_tryimport(tryconfig);
923
924         nvlist_free(tryconfig);
925
926         if (config == NULL)
927                 return (EINVAL);
928
929         error = put_nvlist(zc, config);
930         nvlist_free(config);
931
932         return (error);
933 }
934
935 static int
936 zfs_ioc_pool_scrub(zfs_cmd_t *zc)
937 {
938         spa_t *spa;
939         int error;
940
941         if ((error = spa_open(zc->zc_name, &spa, FTAG)) != 0)
942                 return (error);
943
944         error = spa_scrub(spa, zc->zc_cookie);
945
946         spa_close(spa, FTAG);
947
948         return (error);
949 }
950
951 static int
952 zfs_ioc_pool_freeze(zfs_cmd_t *zc)
953 {
954         spa_t *spa;
955         int error;
956
957         error = spa_open(zc->zc_name, &spa, FTAG);
958         if (error == 0) {
959                 spa_freeze(spa);
960                 spa_close(spa, FTAG);
961         }
962         return (error);
963 }
964
965 static int
966 zfs_ioc_pool_upgrade(zfs_cmd_t *zc)
967 {
968         spa_t *spa;
969         int error;
970
971         if ((error = spa_open(zc->zc_name, &spa, FTAG)) != 0)
972                 return (error);
973
974         if (zc->zc_cookie < spa_version(spa) || zc->zc_cookie > SPA_VERSION) {
975                 spa_close(spa, FTAG);
976                 return (EINVAL);
977         }
978
979         spa_upgrade(spa, zc->zc_cookie);
980         spa_close(spa, FTAG);
981
982         return (error);
983 }
984
985 static int
986 zfs_ioc_pool_get_history(zfs_cmd_t *zc)
987 {
988         spa_t *spa;
989         char *hist_buf;
990         uint64_t size;
991         int error;
992
993         if ((size = zc->zc_history_len) == 0)
994                 return (EINVAL);
995
996         if ((error = spa_open(zc->zc_name, &spa, FTAG)) != 0)
997                 return (error);
998
999         if (spa_version(spa) < SPA_VERSION_ZPOOL_HISTORY) {
1000                 spa_close(spa, FTAG);
1001                 return (ENOTSUP);
1002         }
1003
1004         hist_buf = kmem_alloc(size, KM_SLEEP);
1005         if ((error = spa_history_get(spa, &zc->zc_history_offset,
1006             &zc->zc_history_len, hist_buf)) == 0) {
1007                 error = xcopyout(hist_buf,
1008                     (char *)(uintptr_t)zc->zc_history,
1009                     zc->zc_history_len);
1010         }
1011
1012         spa_close(spa, FTAG);
1013         kmem_free(hist_buf, size);
1014         return (error);
1015 }
1016
1017 static int
1018 zfs_ioc_dsobj_to_dsname(zfs_cmd_t *zc)
1019 {
1020         int error;
1021
1022         if (error = dsl_dsobj_to_dsname(zc->zc_name, zc->zc_obj, zc->zc_value))
1023                 return (error);
1024
1025         return (0);
1026 }
1027
1028 static int
1029 zfs_ioc_obj_to_path(zfs_cmd_t *zc)
1030 {
1031         objset_t *osp;
1032         int error;
1033
1034         if ((error = dmu_objset_open(zc->zc_name, DMU_OST_ZFS,
1035             DS_MODE_USER | DS_MODE_READONLY, &osp)) != 0)
1036                 return (error);
1037         error = zfs_obj_to_path(osp, zc->zc_obj, zc->zc_value,
1038             sizeof (zc->zc_value));
1039         dmu_objset_close(osp);
1040
1041         return (error);
1042 }
1043
1044 static int
1045 zfs_ioc_vdev_add(zfs_cmd_t *zc)
1046 {
1047         spa_t *spa;
1048         int error;
1049         nvlist_t *config, **l2cache, **spares;
1050         uint_t nl2cache = 0, nspares = 0;
1051
1052         error = spa_open(zc->zc_name, &spa, FTAG);
1053         if (error != 0)
1054                 return (error);
1055
1056         error = get_nvlist(zc->zc_nvlist_conf, zc->zc_nvlist_conf_size,
1057             &config);
1058         (void) nvlist_lookup_nvlist_array(config, ZPOOL_CONFIG_L2CACHE,
1059             &l2cache, &nl2cache);
1060
1061         (void) nvlist_lookup_nvlist_array(config, ZPOOL_CONFIG_SPARES,
1062             &spares, &nspares);
1063
1064         /*
1065          * A root pool with concatenated devices is not supported.
1066          * Thus, can not add a device to a root pool.
1067          *
1068          * Intent log device can not be added to a rootpool because
1069          * during mountroot, zil is replayed, a seperated log device
1070          * can not be accessed during the mountroot time.
1071          *
1072          * l2cache and spare devices are ok to be added to a rootpool.
1073          */
1074         if (spa->spa_bootfs != 0 && nl2cache == 0 && nspares == 0) {
1075                 spa_close(spa, FTAG);
1076                 return (EDOM);
1077         }
1078
1079         if (error == 0) {
1080                 error = spa_vdev_add(spa, config);
1081                 nvlist_free(config);
1082         }
1083         spa_close(spa, FTAG);
1084         return (error);
1085 }
1086
1087 static int
1088 zfs_ioc_vdev_remove(zfs_cmd_t *zc)
1089 {
1090         spa_t *spa;
1091         int error;
1092
1093         error = spa_open(zc->zc_name, &spa, FTAG);
1094         if (error != 0)
1095                 return (error);
1096         error = spa_vdev_remove(spa, zc->zc_guid, B_FALSE);
1097         spa_close(spa, FTAG);
1098         return (error);
1099 }
1100
1101 static int
1102 zfs_ioc_vdev_set_state(zfs_cmd_t *zc)
1103 {
1104         spa_t *spa;
1105         int error;
1106         vdev_state_t newstate = VDEV_STATE_UNKNOWN;
1107
1108         if ((error = spa_open(zc->zc_name, &spa, FTAG)) != 0)
1109                 return (error);
1110         switch (zc->zc_cookie) {
1111         case VDEV_STATE_ONLINE:
1112                 error = vdev_online(spa, zc->zc_guid, zc->zc_obj, &newstate);
1113                 break;
1114
1115         case VDEV_STATE_OFFLINE:
1116                 error = vdev_offline(spa, zc->zc_guid, zc->zc_obj);
1117                 break;
1118
1119         case VDEV_STATE_FAULTED:
1120                 error = vdev_fault(spa, zc->zc_guid);
1121                 break;
1122
1123         case VDEV_STATE_DEGRADED:
1124                 error = vdev_degrade(spa, zc->zc_guid);
1125                 break;
1126
1127         default:
1128                 error = EINVAL;
1129         }
1130         zc->zc_cookie = newstate;
1131         spa_close(spa, FTAG);
1132         return (error);
1133 }
1134
1135 static int
1136 zfs_ioc_vdev_attach(zfs_cmd_t *zc)
1137 {
1138         spa_t *spa;
1139         int replacing = zc->zc_cookie;
1140         nvlist_t *config;
1141         int error;
1142
1143         if ((error = spa_open(zc->zc_name, &spa, FTAG)) != 0)
1144                 return (error);
1145
1146         if ((error = get_nvlist(zc->zc_nvlist_conf, zc->zc_nvlist_conf_size,
1147             &config)) == 0) {
1148                 error = spa_vdev_attach(spa, zc->zc_guid, config, replacing);
1149                 nvlist_free(config);
1150         }
1151
1152         spa_close(spa, FTAG);
1153         return (error);
1154 }
1155
1156 static int
1157 zfs_ioc_vdev_detach(zfs_cmd_t *zc)
1158 {
1159         spa_t *spa;
1160         int error;
1161
1162         if ((error = spa_open(zc->zc_name, &spa, FTAG)) != 0)
1163                 return (error);
1164
1165         error = spa_vdev_detach(spa, zc->zc_guid, B_FALSE);
1166
1167         spa_close(spa, FTAG);
1168         return (error);
1169 }
1170
1171 static int
1172 zfs_ioc_vdev_setpath(zfs_cmd_t *zc)
1173 {
1174         spa_t *spa;
1175         char *path = zc->zc_value;
1176         uint64_t guid = zc->zc_guid;
1177         int error;
1178
1179         error = spa_open(zc->zc_name, &spa, FTAG);
1180         if (error != 0)
1181                 return (error);
1182
1183         error = spa_vdev_setpath(spa, guid, path);
1184         spa_close(spa, FTAG);
1185         return (error);
1186 }
1187
1188 /*
1189  * inputs:
1190  * zc_name              name of filesystem
1191  * zc_nvlist_dst_size   size of buffer for property nvlist
1192  *
1193  * outputs:
1194  * zc_objset_stats      stats
1195  * zc_nvlist_dst        property nvlist
1196  * zc_nvlist_dst_size   size of property nvlist
1197  */
1198 static int
1199 zfs_ioc_objset_stats(zfs_cmd_t *zc)
1200 {
1201         objset_t *os = NULL;
1202         int error;
1203         nvlist_t *nv;
1204
1205         if (error = dmu_objset_open(zc->zc_name,
1206             DMU_OST_ANY, DS_MODE_USER | DS_MODE_READONLY, &os))
1207                 return (error);
1208
1209         dmu_objset_fast_stat(os, &zc->zc_objset_stats);
1210
1211         if (zc->zc_nvlist_dst != 0 &&
1212             (error = dsl_prop_get_all(os, &nv, FALSE)) == 0) {
1213                 dmu_objset_stats(os, nv);
1214                 /*
1215                  * NB: zvol_get_stats() will read the objset contents,
1216                  * which we aren't supposed to do with a
1217                  * DS_MODE_USER hold, because it could be
1218                  * inconsistent.  So this is a bit of a workaround...
1219                  */
1220                 if (!zc->zc_objset_stats.dds_inconsistent) {
1221                         if (dmu_objset_type(os) == DMU_OST_ZVOL)
1222                                 VERIFY(zvol_get_stats(os, nv) == 0);
1223                 }
1224                 error = put_nvlist(zc, nv);
1225                 nvlist_free(nv);
1226         }
1227
1228         dmu_objset_close(os);
1229         return (error);
1230 }
1231
1232 static int
1233 nvl_add_zplprop(objset_t *os, nvlist_t *props, zfs_prop_t prop)
1234 {
1235         uint64_t value;
1236         int error;
1237
1238         /*
1239          * zfs_get_zplprop() will either find a value or give us
1240          * the default value (if there is one).
1241          */
1242         if ((error = zfs_get_zplprop(os, prop, &value)) != 0)
1243                 return (error);
1244         VERIFY(nvlist_add_uint64(props, zfs_prop_to_name(prop), value) == 0);
1245         return (0);
1246 }
1247
1248 /*
1249  * inputs:
1250  * zc_name              name of filesystem
1251  * zc_nvlist_dst_size   size of buffer for zpl property nvlist
1252  *
1253  * outputs:
1254  * zc_nvlist_dst        zpl property nvlist
1255  * zc_nvlist_dst_size   size of zpl property nvlist
1256  */
1257 static int
1258 zfs_ioc_objset_zplprops(zfs_cmd_t *zc)
1259 {
1260         objset_t *os;
1261         int err;
1262
1263         if (err = dmu_objset_open(zc->zc_name,
1264             DMU_OST_ANY, DS_MODE_USER | DS_MODE_READONLY, &os))
1265                 return (err);
1266
1267         dmu_objset_fast_stat(os, &zc->zc_objset_stats);
1268
1269         /*
1270          * NB: nvl_add_zplprop() will read the objset contents,
1271          * which we aren't supposed to do with a DS_MODE_USER
1272          * hold, because it could be inconsistent.
1273          */
1274         if (zc->zc_nvlist_dst != NULL &&
1275             !zc->zc_objset_stats.dds_inconsistent &&
1276             dmu_objset_type(os) == DMU_OST_ZFS) {
1277                 nvlist_t *nv;
1278
1279                 VERIFY(nvlist_alloc(&nv, NV_UNIQUE_NAME, KM_SLEEP) == 0);
1280                 if ((err = nvl_add_zplprop(os, nv, ZFS_PROP_VERSION)) == 0 &&
1281                     (err = nvl_add_zplprop(os, nv, ZFS_PROP_NORMALIZE)) == 0 &&
1282                     (err = nvl_add_zplprop(os, nv, ZFS_PROP_UTF8ONLY)) == 0 &&
1283                     (err = nvl_add_zplprop(os, nv, ZFS_PROP_CASE)) == 0)
1284                         err = put_nvlist(zc, nv);
1285                 nvlist_free(nv);
1286         } else {
1287                 err = ENOENT;
1288         }
1289         dmu_objset_close(os);
1290         return (err);
1291 }
1292
1293 /*
1294  * inputs:
1295  * zc_name              name of filesystem
1296  * zc_cookie            zap cursor
1297  * zc_nvlist_dst_size   size of buffer for property nvlist
1298  *
1299  * outputs:
1300  * zc_name              name of next filesystem
1301  * zc_objset_stats      stats
1302  * zc_nvlist_dst        property nvlist
1303  * zc_nvlist_dst_size   size of property nvlist
1304  */
1305 static int
1306 zfs_ioc_dataset_list_next(zfs_cmd_t *zc)
1307 {
1308         objset_t *os;
1309         int error;
1310         char *p;
1311
1312         if (error = dmu_objset_open(zc->zc_name,
1313             DMU_OST_ANY, DS_MODE_USER | DS_MODE_READONLY, &os)) {
1314                 if (error == ENOENT)
1315                         error = ESRCH;
1316                 return (error);
1317         }
1318
1319         p = strrchr(zc->zc_name, '/');
1320         if (p == NULL || p[1] != '\0')
1321                 (void) strlcat(zc->zc_name, "/", sizeof (zc->zc_name));
1322         p = zc->zc_name + strlen(zc->zc_name);
1323
1324         do {
1325                 error = dmu_dir_list_next(os,
1326                     sizeof (zc->zc_name) - (p - zc->zc_name), p,
1327                     NULL, &zc->zc_cookie);
1328                 if (error == ENOENT)
1329                         error = ESRCH;
1330         } while (error == 0 && !INGLOBALZONE(curproc) &&
1331             !zone_dataset_visible(zc->zc_name, NULL));
1332         dmu_objset_close(os);
1333
1334         /*
1335          * If it's a hidden dataset (ie. with a '$' in its name), don't
1336          * try to get stats for it.  Userland will skip over it.
1337          */
1338         if (error == 0 && strchr(zc->zc_name, '$') == NULL)
1339                 error = zfs_ioc_objset_stats(zc); /* fill in the stats */
1340
1341         return (error);
1342 }
1343
1344 /*
1345  * inputs:
1346  * zc_name              name of filesystem
1347  * zc_cookie            zap cursor
1348  * zc_nvlist_dst_size   size of buffer for property nvlist
1349  *
1350  * outputs:
1351  * zc_name              name of next snapshot
1352  * zc_objset_stats      stats
1353  * zc_nvlist_dst        property nvlist
1354  * zc_nvlist_dst_size   size of property nvlist
1355  */
1356 static int
1357 zfs_ioc_snapshot_list_next(zfs_cmd_t *zc)
1358 {
1359         objset_t *os;
1360         int error;
1361
1362         error = dmu_objset_open(zc->zc_name,
1363             DMU_OST_ANY, DS_MODE_USER | DS_MODE_READONLY, &os);
1364         if (error)
1365                 return (error == ENOENT ? ESRCH : error);
1366
1367         /*
1368          * A dataset name of maximum length cannot have any snapshots,
1369          * so exit immediately.
1370          */
1371         if (strlcat(zc->zc_name, "@", sizeof (zc->zc_name)) >= MAXNAMELEN) {
1372                 dmu_objset_close(os);
1373                 return (ESRCH);
1374         }
1375
1376         error = dmu_snapshot_list_next(os,
1377             sizeof (zc->zc_name) - strlen(zc->zc_name),
1378             zc->zc_name + strlen(zc->zc_name), NULL, &zc->zc_cookie, NULL);
1379         dmu_objset_close(os);
1380         if (error == 0)
1381                 error = zfs_ioc_objset_stats(zc); /* fill in the stats */
1382         else if (error == ENOENT)
1383                 error = ESRCH;
1384
1385         /* if we failed, undo the @ that we tacked on to zc_name */
1386         if (error)
1387                 *strchr(zc->zc_name, '@') = '\0';
1388         return (error);
1389 }
1390
1391 int
1392 zfs_set_prop_nvlist(const char *name, nvlist_t *nvl)
1393 {
1394         nvpair_t *elem;
1395         int error;
1396         uint64_t intval;
1397         char *strval;
1398
1399         /*
1400          * First validate permission to set all of the properties
1401          */
1402         elem = NULL;
1403         while ((elem = nvlist_next_nvpair(nvl, elem)) != NULL) {
1404                 const char *propname = nvpair_name(elem);
1405                 zfs_prop_t prop = zfs_name_to_prop(propname);
1406
1407                 if (prop == ZPROP_INVAL) {
1408                         /*
1409                          * If this is a user-defined property, it must be a
1410                          * string, and there is no further validation to do.
1411                          */
1412                         if (!zfs_prop_user(propname) ||
1413                             nvpair_type(elem) != DATA_TYPE_STRING)
1414                                 return (EINVAL);
1415
1416                         if (error = zfs_secpolicy_write_perms(name,
1417                             ZFS_DELEG_PERM_USERPROP, CRED()))
1418                                 return (error);
1419                         continue;
1420                 }
1421
1422                 if ((error = zfs_secpolicy_setprop(name, prop, CRED())) != 0)
1423                         return (error);
1424
1425                 /*
1426                  * Check that this value is valid for this pool version
1427                  */
1428                 switch (prop) {
1429                 case ZFS_PROP_COMPRESSION:
1430                         /*
1431                          * If the user specified gzip compression, make sure
1432                          * the SPA supports it. We ignore any errors here since
1433                          * we'll catch them later.
1434                          */
1435                         if (nvpair_type(elem) == DATA_TYPE_UINT64 &&
1436                             nvpair_value_uint64(elem, &intval) == 0) {
1437                                 if (intval >= ZIO_COMPRESS_GZIP_1 &&
1438                                     intval <= ZIO_COMPRESS_GZIP_9 &&
1439                                     zfs_earlier_version(name,
1440                                     SPA_VERSION_GZIP_COMPRESSION))
1441                                         return (ENOTSUP);
1442
1443                                 /*
1444                                  * If this is a bootable dataset then
1445                                  * verify that the compression algorithm
1446                                  * is supported for booting. We must return
1447                                  * something other than ENOTSUP since it
1448                                  * implies a downrev pool version.
1449                                  */
1450                                 if (zfs_is_bootfs(name) &&
1451                                     !BOOTFS_COMPRESS_VALID(intval))
1452                                         return (ERANGE);
1453                         }
1454                         break;
1455
1456                 case ZFS_PROP_COPIES:
1457                         if (zfs_earlier_version(name,
1458                             SPA_VERSION_DITTO_BLOCKS))
1459                                 return (ENOTSUP);
1460                         break;
1461
1462                 case ZFS_PROP_SHARESMB:
1463                         if (zpl_earlier_version(name, ZPL_VERSION_FUID))
1464                                 return (ENOTSUP);
1465                         break;
1466
1467                 case ZFS_PROP_ACLINHERIT:
1468                         if (nvpair_type(elem) == DATA_TYPE_UINT64 &&
1469                             nvpair_value_uint64(elem, &intval) == 0)
1470                                 if (intval == ZFS_ACL_PASSTHROUGH_X &&
1471                                     zfs_earlier_version(name,
1472                                     SPA_VERSION_PASSTHROUGH_X))
1473                                         return (ENOTSUP);
1474                 }
1475         }
1476
1477         elem = NULL;
1478         while ((elem = nvlist_next_nvpair(nvl, elem)) != NULL) {
1479                 const char *propname = nvpair_name(elem);
1480                 zfs_prop_t prop = zfs_name_to_prop(propname);
1481
1482                 if (prop == ZPROP_INVAL) {
1483                         VERIFY(nvpair_value_string(elem, &strval) == 0);
1484                         error = dsl_prop_set(name, propname, 1,
1485                             strlen(strval) + 1, strval);
1486                         if (error == 0)
1487                                 continue;
1488                         else
1489                                 return (error);
1490                 }
1491
1492                 switch (prop) {
1493                 case ZFS_PROP_QUOTA:
1494                         if ((error = nvpair_value_uint64(elem, &intval)) != 0 ||
1495                             (error = dsl_dir_set_quota(name, intval)) != 0)
1496                                 return (error);
1497                         break;
1498
1499                 case ZFS_PROP_REFQUOTA:
1500                         if ((error = nvpair_value_uint64(elem, &intval)) != 0 ||
1501                             (error = dsl_dataset_set_quota(name, intval)) != 0)
1502                                 return (error);
1503                         break;
1504
1505                 case ZFS_PROP_RESERVATION:
1506                         if ((error = nvpair_value_uint64(elem, &intval)) != 0 ||
1507                             (error = dsl_dir_set_reservation(name,
1508                             intval)) != 0)
1509                                 return (error);
1510                         break;
1511
1512                 case ZFS_PROP_REFRESERVATION:
1513                         if ((error = nvpair_value_uint64(elem, &intval)) != 0 ||
1514                             (error = dsl_dataset_set_reservation(name,
1515                             intval)) != 0)
1516                                 return (error);
1517                         break;
1518
1519                 case ZFS_PROP_VOLSIZE:
1520                         if ((error = nvpair_value_uint64(elem, &intval)) != 0 ||
1521                             (error = zvol_set_volsize(name,
1522                             ddi_driver_major(zfs_dip), intval)) != 0)
1523                                 return (error);
1524                         break;
1525
1526                 case ZFS_PROP_VOLBLOCKSIZE:
1527                         if ((error = nvpair_value_uint64(elem, &intval)) != 0 ||
1528                             (error = zvol_set_volblocksize(name, intval)) != 0)
1529                                 return (error);
1530                         break;
1531
1532                 case ZFS_PROP_VERSION:
1533                         if ((error = nvpair_value_uint64(elem, &intval)) != 0 ||
1534                             (error = zfs_set_version(name, intval)) != 0)
1535                                 return (error);
1536                         break;
1537
1538                 default:
1539                         if (nvpair_type(elem) == DATA_TYPE_STRING) {
1540                                 if (zfs_prop_get_type(prop) !=
1541                                     PROP_TYPE_STRING)
1542                                         return (EINVAL);
1543                                 VERIFY(nvpair_value_string(elem, &strval) == 0);
1544                                 if ((error = dsl_prop_set(name,
1545                                     nvpair_name(elem), 1, strlen(strval) + 1,
1546                                     strval)) != 0)
1547                                         return (error);
1548                         } else if (nvpair_type(elem) == DATA_TYPE_UINT64) {
1549                                 const char *unused;
1550
1551                                 VERIFY(nvpair_value_uint64(elem, &intval) == 0);
1552
1553                                 switch (zfs_prop_get_type(prop)) {
1554                                 case PROP_TYPE_NUMBER:
1555                                         break;
1556                                 case PROP_TYPE_STRING:
1557                                         return (EINVAL);
1558                                 case PROP_TYPE_INDEX:
1559                                         if (zfs_prop_index_to_string(prop,
1560                                             intval, &unused) != 0)
1561                                                 return (EINVAL);
1562                                         break;
1563                                 default:
1564                                         cmn_err(CE_PANIC,
1565                                             "unknown property type");
1566                                         break;
1567                                 }
1568
1569                                 if ((error = dsl_prop_set(name, propname,
1570                                     8, 1, &intval)) != 0)
1571                                         return (error);
1572                         } else {
1573                                 return (EINVAL);
1574                         }
1575                         break;
1576                 }
1577         }
1578
1579         return (0);
1580 }
1581
1582 /*
1583  * inputs:
1584  * zc_name              name of filesystem
1585  * zc_value             name of property to inherit
1586  * zc_nvlist_src{_size} nvlist of properties to apply
1587  * zc_cookie            clear existing local props?
1588  *
1589  * outputs:             none
1590  */
1591 static int
1592 zfs_ioc_set_prop(zfs_cmd_t *zc)
1593 {
1594         nvlist_t *nvl;
1595         int error;
1596
1597         if ((error = get_nvlist(zc->zc_nvlist_src, zc->zc_nvlist_src_size,
1598             &nvl)) != 0)
1599                 return (error);
1600
1601         if (zc->zc_cookie) {
1602                 nvlist_t *origprops;
1603                 objset_t *os;
1604
1605                 if (dmu_objset_open(zc->zc_name, DMU_OST_ANY,
1606                     DS_MODE_USER | DS_MODE_READONLY, &os) == 0) {
1607                         if (dsl_prop_get_all(os, &origprops, TRUE) == 0) {
1608                                 clear_props(zc->zc_name, origprops);
1609                                 nvlist_free(origprops);
1610                         }
1611                         dmu_objset_close(os);
1612                 }
1613
1614         }
1615
1616         error = zfs_set_prop_nvlist(zc->zc_name, nvl);
1617
1618         nvlist_free(nvl);
1619         return (error);
1620 }
1621
1622 /*
1623  * inputs:
1624  * zc_name              name of filesystem
1625  * zc_value             name of property to inherit
1626  *
1627  * outputs:             none
1628  */
1629 static int
1630 zfs_ioc_inherit_prop(zfs_cmd_t *zc)
1631 {
1632         /* the property name has been validated by zfs_secpolicy_inherit() */
1633         return (dsl_prop_set(zc->zc_name, zc->zc_value, 0, 0, NULL));
1634 }
1635
1636 static int
1637 zfs_ioc_pool_set_props(zfs_cmd_t *zc)
1638 {
1639         nvlist_t *props;
1640         spa_t *spa;
1641         int error;
1642
1643         if ((error = get_nvlist(zc->zc_nvlist_src, zc->zc_nvlist_src_size,
1644             &props)))
1645                 return (error);
1646
1647         if ((error = spa_open(zc->zc_name, &spa, FTAG)) != 0) {
1648                 nvlist_free(props);
1649                 return (error);
1650         }
1651
1652         error = spa_prop_set(spa, props);
1653
1654         nvlist_free(props);
1655         spa_close(spa, FTAG);
1656
1657         return (error);
1658 }
1659
1660 static int
1661 zfs_ioc_pool_get_props(zfs_cmd_t *zc)
1662 {
1663         spa_t *spa;
1664         int error;
1665         nvlist_t *nvp = NULL;
1666
1667         if ((error = spa_open(zc->zc_name, &spa, FTAG)) != 0)
1668                 return (error);
1669
1670         error = spa_prop_get(spa, &nvp);
1671
1672         if (error == 0 && zc->zc_nvlist_dst != NULL)
1673                 error = put_nvlist(zc, nvp);
1674         else
1675                 error = EFAULT;
1676
1677         spa_close(spa, FTAG);
1678
1679         if (nvp)
1680                 nvlist_free(nvp);
1681         return (error);
1682 }
1683
1684 static int
1685 zfs_ioc_iscsi_perm_check(zfs_cmd_t *zc)
1686 {
1687         nvlist_t *nvp;
1688         int error;
1689         uint32_t uid;
1690         uint32_t gid;
1691         uint32_t *groups;
1692         uint_t group_cnt;
1693         cred_t  *usercred;
1694
1695         if ((error = get_nvlist(zc->zc_nvlist_src, zc->zc_nvlist_src_size,
1696             &nvp)) != 0) {
1697                 return (error);
1698         }
1699
1700         if ((error = nvlist_lookup_uint32(nvp,
1701             ZFS_DELEG_PERM_UID, &uid)) != 0) {
1702                 nvlist_free(nvp);
1703                 return (EPERM);
1704         }
1705
1706         if ((error = nvlist_lookup_uint32(nvp,
1707             ZFS_DELEG_PERM_GID, &gid)) != 0) {
1708                 nvlist_free(nvp);
1709                 return (EPERM);
1710         }
1711
1712         if ((error = nvlist_lookup_uint32_array(nvp, ZFS_DELEG_PERM_GROUPS,
1713             &groups, &group_cnt)) != 0) {
1714                 nvlist_free(nvp);
1715                 return (EPERM);
1716         }
1717         usercred = cralloc();
1718         if ((crsetugid(usercred, uid, gid) != 0) ||
1719             (crsetgroups(usercred, group_cnt, (gid_t *)groups) != 0)) {
1720                 nvlist_free(nvp);
1721                 crfree(usercred);
1722                 return (EPERM);
1723         }
1724         nvlist_free(nvp);
1725         error = dsl_deleg_access(zc->zc_name,
1726             zfs_prop_to_name(ZFS_PROP_SHAREISCSI), usercred);
1727         crfree(usercred);
1728         return (error);
1729 }
1730
1731 /*
1732  * inputs:
1733  * zc_name              name of filesystem
1734  * zc_nvlist_src{_size} nvlist of delegated permissions
1735  * zc_perm_action       allow/unallow flag
1736  *
1737  * outputs:             none
1738  */
1739 static int
1740 zfs_ioc_set_fsacl(zfs_cmd_t *zc)
1741 {
1742         int error;
1743         nvlist_t *fsaclnv = NULL;
1744
1745         if ((error = get_nvlist(zc->zc_nvlist_src, zc->zc_nvlist_src_size,
1746             &fsaclnv)) != 0)
1747                 return (error);
1748
1749         /*
1750          * Verify nvlist is constructed correctly
1751          */
1752         if ((error = zfs_deleg_verify_nvlist(fsaclnv)) != 0) {
1753                 nvlist_free(fsaclnv);
1754                 return (EINVAL);
1755         }
1756
1757         /*
1758          * If we don't have PRIV_SYS_MOUNT, then validate
1759          * that user is allowed to hand out each permission in
1760          * the nvlist(s)
1761          */
1762
1763         error = secpolicy_zfs(CRED());
1764         if (error) {
1765                 if (zc->zc_perm_action == B_FALSE) {
1766                         error = dsl_deleg_can_allow(zc->zc_name,
1767                             fsaclnv, CRED());
1768                 } else {
1769                         error = dsl_deleg_can_unallow(zc->zc_name,
1770                             fsaclnv, CRED());
1771                 }
1772         }
1773
1774         if (error == 0)
1775                 error = dsl_deleg_set(zc->zc_name, fsaclnv, zc->zc_perm_action);
1776
1777         nvlist_free(fsaclnv);
1778         return (error);
1779 }
1780
1781 /*
1782  * inputs:
1783  * zc_name              name of filesystem
1784  *
1785  * outputs:
1786  * zc_nvlist_src{_size} nvlist of delegated permissions
1787  */
1788 static int
1789 zfs_ioc_get_fsacl(zfs_cmd_t *zc)
1790 {
1791         nvlist_t *nvp;
1792         int error;
1793
1794         if ((error = dsl_deleg_get(zc->zc_name, &nvp)) == 0) {
1795                 error = put_nvlist(zc, nvp);
1796                 nvlist_free(nvp);
1797         }
1798
1799         return (error);
1800 }
1801
1802 /*
1803  * inputs:
1804  * zc_name              name of volume
1805  *
1806  * outputs:             none
1807  */
1808 static int
1809 zfs_ioc_create_minor(zfs_cmd_t *zc)
1810 {
1811         return (zvol_create_minor(zc->zc_name, ddi_driver_major(zfs_dip)));
1812 }
1813
1814 /*
1815  * inputs:
1816  * zc_name              name of volume
1817  *
1818  * outputs:             none
1819  */
1820 static int
1821 zfs_ioc_remove_minor(zfs_cmd_t *zc)
1822 {
1823         return (zvol_remove_minor(zc->zc_name));
1824 }
1825
1826 /*
1827  * Search the vfs list for a specified resource.  Returns a pointer to it
1828  * or NULL if no suitable entry is found. The caller of this routine
1829  * is responsible for releasing the returned vfs pointer.
1830  */
1831 static vfs_t *
1832 zfs_get_vfs(const char *resource)
1833 {
1834         struct vfs *vfsp;
1835         struct vfs *vfs_found = NULL;
1836
1837         vfs_list_read_lock();
1838         vfsp = rootvfs;
1839         do {
1840                 if (strcmp(refstr_value(vfsp->vfs_resource), resource) == 0) {
1841                         VFS_HOLD(vfsp);
1842                         vfs_found = vfsp;
1843                         break;
1844                 }
1845                 vfsp = vfsp->vfs_next;
1846         } while (vfsp != rootvfs);
1847         vfs_list_unlock();
1848         return (vfs_found);
1849 }
1850
1851 /* ARGSUSED */
1852 static void
1853 zfs_create_cb(objset_t *os, void *arg, cred_t *cr, dmu_tx_t *tx)
1854 {
1855         zfs_creat_t *zct = arg;
1856
1857         zfs_create_fs(os, cr, zct->zct_zplprops, tx);
1858 }
1859
1860 #define ZFS_PROP_UNDEFINED      ((uint64_t)-1)
1861
1862 /*
1863  * inputs:
1864  * createprops          list of properties requested by creator
1865  * default_zplver       zpl version to use if unspecified in createprops
1866  * fuids_ok             fuids allowed in this version of the spa?
1867  * os                   parent objset pointer (NULL if root fs)
1868  *
1869  * outputs:
1870  * zplprops     values for the zplprops we attach to the master node object
1871  * is_ci        true if requested file system will be purely case-insensitive
1872  *
1873  * Determine the settings for utf8only, normalization and
1874  * casesensitivity.  Specific values may have been requested by the
1875  * creator and/or we can inherit values from the parent dataset.  If
1876  * the file system is of too early a vintage, a creator can not
1877  * request settings for these properties, even if the requested
1878  * setting is the default value.  We don't actually want to create dsl
1879  * properties for these, so remove them from the source nvlist after
1880  * processing.
1881  */
1882 static int
1883 zfs_fill_zplprops_impl(objset_t *os, uint64_t default_zplver,
1884     boolean_t fuids_ok, nvlist_t *createprops, nvlist_t *zplprops,
1885     boolean_t *is_ci)
1886 {
1887         uint64_t zplver = default_zplver;
1888         uint64_t sense = ZFS_PROP_UNDEFINED;
1889         uint64_t norm = ZFS_PROP_UNDEFINED;
1890         uint64_t u8 = ZFS_PROP_UNDEFINED;
1891
1892         ASSERT(zplprops != NULL);
1893
1894         /*
1895          * Pull out creator prop choices, if any.
1896          */
1897         if (createprops) {
1898                 (void) nvlist_lookup_uint64(createprops,
1899                     zfs_prop_to_name(ZFS_PROP_VERSION), &zplver);
1900                 (void) nvlist_lookup_uint64(createprops,
1901                     zfs_prop_to_name(ZFS_PROP_NORMALIZE), &norm);
1902                 (void) nvlist_remove_all(createprops,
1903                     zfs_prop_to_name(ZFS_PROP_NORMALIZE));
1904                 (void) nvlist_lookup_uint64(createprops,
1905                     zfs_prop_to_name(ZFS_PROP_UTF8ONLY), &u8);
1906                 (void) nvlist_remove_all(createprops,
1907                     zfs_prop_to_name(ZFS_PROP_UTF8ONLY));
1908                 (void) nvlist_lookup_uint64(createprops,
1909                     zfs_prop_to_name(ZFS_PROP_CASE), &sense);
1910                 (void) nvlist_remove_all(createprops,
1911                     zfs_prop_to_name(ZFS_PROP_CASE));
1912         }
1913
1914         /*
1915          * If the zpl version requested is whacky or the file system
1916          * or pool is version is too "young" to support normalization
1917          * and the creator tried to set a value for one of the props,
1918          * error out.
1919          */
1920         if ((zplver < ZPL_VERSION_INITIAL || zplver > ZPL_VERSION) ||
1921             (zplver >= ZPL_VERSION_FUID && !fuids_ok) ||
1922             (zplver < ZPL_VERSION_NORMALIZATION &&
1923             (norm != ZFS_PROP_UNDEFINED || u8 != ZFS_PROP_UNDEFINED ||
1924             sense != ZFS_PROP_UNDEFINED)))
1925                 return (ENOTSUP);
1926
1927         /*
1928          * Put the version in the zplprops
1929          */
1930         VERIFY(nvlist_add_uint64(zplprops,
1931             zfs_prop_to_name(ZFS_PROP_VERSION), zplver) == 0);
1932
1933         if (norm == ZFS_PROP_UNDEFINED)
1934                 VERIFY(zfs_get_zplprop(os, ZFS_PROP_NORMALIZE, &norm) == 0);
1935         VERIFY(nvlist_add_uint64(zplprops,
1936             zfs_prop_to_name(ZFS_PROP_NORMALIZE), norm) == 0);
1937
1938         /*
1939          * If we're normalizing, names must always be valid UTF-8 strings.
1940          */
1941         if (norm)
1942                 u8 = 1;
1943         if (u8 == ZFS_PROP_UNDEFINED)
1944                 VERIFY(zfs_get_zplprop(os, ZFS_PROP_UTF8ONLY, &u8) == 0);
1945         VERIFY(nvlist_add_uint64(zplprops,
1946             zfs_prop_to_name(ZFS_PROP_UTF8ONLY), u8) == 0);
1947
1948         if (sense == ZFS_PROP_UNDEFINED)
1949                 VERIFY(zfs_get_zplprop(os, ZFS_PROP_CASE, &sense) == 0);
1950         VERIFY(nvlist_add_uint64(zplprops,
1951             zfs_prop_to_name(ZFS_PROP_CASE), sense) == 0);
1952
1953         if (is_ci)
1954                 *is_ci = (sense == ZFS_CASE_INSENSITIVE);
1955
1956         return (0);
1957 }
1958
1959 static int
1960 zfs_fill_zplprops(const char *dataset, nvlist_t *createprops,
1961     nvlist_t *zplprops, boolean_t *is_ci)
1962 {
1963         boolean_t fuids_ok = B_TRUE;
1964         uint64_t zplver = ZPL_VERSION;
1965         objset_t *os = NULL;
1966         char parentname[MAXNAMELEN];
1967         char *cp;
1968         int error;
1969
1970         (void) strlcpy(parentname, dataset, sizeof (parentname));
1971         cp = strrchr(parentname, '/');
1972         ASSERT(cp != NULL);
1973         cp[0] = '\0';
1974
1975         if (zfs_earlier_version(dataset, SPA_VERSION_FUID)) {
1976                 zplver = ZPL_VERSION_FUID - 1;
1977                 fuids_ok = B_FALSE;
1978         }
1979
1980         /*
1981          * Open parent object set so we can inherit zplprop values.
1982          */
1983         if ((error = dmu_objset_open(parentname, DMU_OST_ANY,
1984             DS_MODE_USER | DS_MODE_READONLY, &os)) != 0)
1985                 return (error);
1986
1987         error = zfs_fill_zplprops_impl(os, zplver, fuids_ok, createprops,
1988             zplprops, is_ci);
1989         dmu_objset_close(os);
1990         return (error);
1991 }
1992
1993 static int
1994 zfs_fill_zplprops_root(uint64_t spa_vers, nvlist_t *createprops,
1995     nvlist_t *zplprops, boolean_t *is_ci)
1996 {
1997         boolean_t fuids_ok = B_TRUE;
1998         uint64_t zplver = ZPL_VERSION;
1999         int error;
2000
2001         if (spa_vers < SPA_VERSION_FUID) {
2002                 zplver = ZPL_VERSION_FUID - 1;
2003                 fuids_ok = B_FALSE;
2004         }
2005
2006         error = zfs_fill_zplprops_impl(NULL, zplver, fuids_ok, createprops,
2007             zplprops, is_ci);
2008         return (error);
2009 }
2010
2011 /*
2012  * inputs:
2013  * zc_objset_type       type of objset to create (fs vs zvol)
2014  * zc_name              name of new objset
2015  * zc_value             name of snapshot to clone from (may be empty)
2016  * zc_nvlist_src{_size} nvlist of properties to apply
2017  *
2018  * outputs: none
2019  */
2020 static int
2021 zfs_ioc_create(zfs_cmd_t *zc)
2022 {
2023         objset_t *clone;
2024         int error = 0;
2025         zfs_creat_t zct;
2026         nvlist_t *nvprops = NULL;
2027         void (*cbfunc)(objset_t *os, void *arg, cred_t *cr, dmu_tx_t *tx);
2028         dmu_objset_type_t type = zc->zc_objset_type;
2029
2030         switch (type) {
2031
2032         case DMU_OST_ZFS:
2033                 cbfunc = zfs_create_cb;
2034                 break;
2035
2036         case DMU_OST_ZVOL:
2037                 cbfunc = zvol_create_cb;
2038                 break;
2039
2040         default:
2041                 cbfunc = NULL;
2042                 break;
2043         }
2044         if (strchr(zc->zc_name, '@') ||
2045             strchr(zc->zc_name, '%'))
2046                 return (EINVAL);
2047
2048         if (zc->zc_nvlist_src != NULL &&
2049             (error = get_nvlist(zc->zc_nvlist_src, zc->zc_nvlist_src_size,
2050             &nvprops)) != 0)
2051                 return (error);
2052
2053         zct.zct_zplprops = NULL;
2054         zct.zct_props = nvprops;
2055
2056         if (zc->zc_value[0] != '\0') {
2057                 /*
2058                  * We're creating a clone of an existing snapshot.
2059                  */
2060                 zc->zc_value[sizeof (zc->zc_value) - 1] = '\0';
2061                 if (dataset_namecheck(zc->zc_value, NULL, NULL) != 0) {
2062                         nvlist_free(nvprops);
2063                         return (EINVAL);
2064                 }
2065
2066                 error = dmu_objset_open(zc->zc_value, type,
2067                     DS_MODE_USER | DS_MODE_READONLY, &clone);
2068                 if (error) {
2069                         nvlist_free(nvprops);
2070                         return (error);
2071                 }
2072
2073                 error = dmu_objset_create(zc->zc_name, type, clone, 0,
2074                     NULL, NULL);
2075                 if (error) {
2076                         dmu_objset_close(clone);
2077                         nvlist_free(nvprops);
2078                         return (error);
2079                 }
2080                 dmu_objset_close(clone);
2081         } else {
2082                 boolean_t is_insensitive = B_FALSE;
2083
2084                 if (cbfunc == NULL) {
2085                         nvlist_free(nvprops);
2086                         return (EINVAL);
2087                 }
2088
2089                 if (type == DMU_OST_ZVOL) {
2090                         uint64_t volsize, volblocksize;
2091
2092                         if (nvprops == NULL ||
2093                             nvlist_lookup_uint64(nvprops,
2094                             zfs_prop_to_name(ZFS_PROP_VOLSIZE),
2095                             &volsize) != 0) {
2096                                 nvlist_free(nvprops);
2097                                 return (EINVAL);
2098                         }
2099
2100                         if ((error = nvlist_lookup_uint64(nvprops,
2101                             zfs_prop_to_name(ZFS_PROP_VOLBLOCKSIZE),
2102                             &volblocksize)) != 0 && error != ENOENT) {
2103                                 nvlist_free(nvprops);
2104                                 return (EINVAL);
2105                         }
2106
2107                         if (error != 0)
2108                                 volblocksize = zfs_prop_default_numeric(
2109                                     ZFS_PROP_VOLBLOCKSIZE);
2110
2111                         if ((error = zvol_check_volblocksize(
2112                             volblocksize)) != 0 ||
2113                             (error = zvol_check_volsize(volsize,
2114                             volblocksize)) != 0) {
2115                                 nvlist_free(nvprops);
2116                                 return (error);
2117                         }
2118                 } else if (type == DMU_OST_ZFS) {
2119                         int error;
2120
2121                         /*
2122                          * We have to have normalization and
2123                          * case-folding flags correct when we do the
2124                          * file system creation, so go figure them out
2125                          * now.
2126                          */
2127                         VERIFY(nvlist_alloc(&zct.zct_zplprops,
2128                             NV_UNIQUE_NAME, KM_SLEEP) == 0);
2129                         error = zfs_fill_zplprops(zc->zc_name, nvprops,
2130                             zct.zct_zplprops, &is_insensitive);
2131                         if (error != 0) {
2132                                 nvlist_free(nvprops);
2133                                 nvlist_free(zct.zct_zplprops);
2134                                 return (error);
2135                         }
2136                 }
2137                 error = dmu_objset_create(zc->zc_name, type, NULL,
2138                     is_insensitive ? DS_FLAG_CI_DATASET : 0, cbfunc, &zct);
2139                 nvlist_free(zct.zct_zplprops);
2140         }
2141
2142         /*
2143          * It would be nice to do this atomically.
2144          */
2145         if (error == 0) {
2146                 if ((error = zfs_set_prop_nvlist(zc->zc_name, nvprops)) != 0)
2147                         (void) dmu_objset_destroy(zc->zc_name);
2148         }
2149         nvlist_free(nvprops);
2150         return (error);
2151 }
2152
2153 struct snap_prop_arg {
2154         nvlist_t *nvprops;
2155         const char *snapname;
2156 };
2157
2158 static int
2159 set_snap_props(char *name, void *arg)
2160 {
2161         struct snap_prop_arg *snpa = arg;
2162         int len = strlen(name) + strlen(snpa->snapname) + 2;
2163         char *buf = kmem_alloc(len, KM_SLEEP);
2164         int err;
2165
2166         (void) snprintf(buf, len, "%s@%s", name, snpa->snapname);
2167         err = zfs_set_prop_nvlist(buf, snpa->nvprops);
2168         if (err)
2169                 (void) dmu_objset_destroy(buf);
2170         kmem_free(buf, len);
2171         return (err);
2172 }
2173
2174 /*
2175  * inputs:
2176  * zc_name      name of filesystem
2177  * zc_value     short name of snapshot
2178  * zc_cookie    recursive flag
2179  *
2180  * outputs:     none
2181  */
2182 static int
2183 zfs_ioc_snapshot(zfs_cmd_t *zc)
2184 {
2185         nvlist_t *nvprops = NULL;
2186         int error;
2187         boolean_t recursive = zc->zc_cookie;
2188
2189         if (snapshot_namecheck(zc->zc_value, NULL, NULL) != 0)
2190                 return (EINVAL);
2191
2192         if (zc->zc_nvlist_src != NULL &&
2193             (error = get_nvlist(zc->zc_nvlist_src, zc->zc_nvlist_src_size,
2194             &nvprops)) != 0)
2195                 return (error);
2196
2197         error = dmu_objset_snapshot(zc->zc_name, zc->zc_value, recursive);
2198
2199         /*
2200          * It would be nice to do this atomically.
2201          */
2202         if (error == 0) {
2203                 struct snap_prop_arg snpa;
2204                 snpa.nvprops = nvprops;
2205                 snpa.snapname = zc->zc_value;
2206                 if (recursive) {
2207                         error = dmu_objset_find(zc->zc_name,
2208                             set_snap_props, &snpa, DS_FIND_CHILDREN);
2209                         if (error) {
2210                                 (void) dmu_snapshots_destroy(zc->zc_name,
2211                                     zc->zc_value);
2212                         }
2213                 } else {
2214                         error = set_snap_props(zc->zc_name, &snpa);
2215                 }
2216         }
2217         nvlist_free(nvprops);
2218         return (error);
2219 }
2220
2221 int
2222 zfs_unmount_snap(char *name, void *arg)
2223 {
2224         vfs_t *vfsp = NULL;
2225
2226         if (arg) {
2227                 char *snapname = arg;
2228                 int len = strlen(name) + strlen(snapname) + 2;
2229                 char *buf = kmem_alloc(len, KM_SLEEP);
2230
2231                 (void) strcpy(buf, name);
2232                 (void) strcat(buf, "@");
2233                 (void) strcat(buf, snapname);
2234                 vfsp = zfs_get_vfs(buf);
2235                 kmem_free(buf, len);
2236         } else if (strchr(name, '@')) {
2237                 vfsp = zfs_get_vfs(name);
2238         }
2239
2240         if (vfsp) {
2241                 /*
2242                  * Always force the unmount for snapshots.
2243                  */
2244                 int flag = MS_FORCE;
2245                 int err;
2246
2247                 if ((err = vn_vfswlock(vfsp->vfs_vnodecovered)) != 0) {
2248                         VFS_RELE(vfsp);
2249                         return (err);
2250                 }
2251                 VFS_RELE(vfsp);
2252                 if ((err = dounmount(vfsp, flag, kcred)) != 0)
2253                         return (err);
2254         }
2255         return (0);
2256 }
2257
2258 /*
2259  * inputs:
2260  * zc_name      name of filesystem
2261  * zc_value     short name of snapshot
2262  *
2263  * outputs:     none
2264  */
2265 static int
2266 zfs_ioc_destroy_snaps(zfs_cmd_t *zc)
2267 {
2268         int err;
2269
2270         if (snapshot_namecheck(zc->zc_value, NULL, NULL) != 0)
2271                 return (EINVAL);
2272         err = dmu_objset_find(zc->zc_name,
2273             zfs_unmount_snap, zc->zc_value, DS_FIND_CHILDREN);
2274         if (err)
2275                 return (err);
2276         return (dmu_snapshots_destroy(zc->zc_name, zc->zc_value));
2277 }
2278
2279 /*
2280  * inputs:
2281  * zc_name              name of dataset to destroy
2282  * zc_objset_type       type of objset
2283  *
2284  * outputs:             none
2285  */
2286 static int
2287 zfs_ioc_destroy(zfs_cmd_t *zc)
2288 {
2289         if (strchr(zc->zc_name, '@') && zc->zc_objset_type == DMU_OST_ZFS) {
2290                 int err = zfs_unmount_snap(zc->zc_name, NULL);
2291                 if (err)
2292                         return (err);
2293         }
2294
2295         return (dmu_objset_destroy(zc->zc_name));
2296 }
2297
2298 /*
2299  * inputs:
2300  * zc_name      name of dataset to rollback (to most recent snapshot)
2301  *
2302  * outputs:     none
2303  */
2304 static int
2305 zfs_ioc_rollback(zfs_cmd_t *zc)
2306 {
2307         objset_t *os;
2308         int error;
2309         zfsvfs_t *zfsvfs = NULL;
2310
2311         /*
2312          * Get the zfsvfs for the receiving objset. There
2313          * won't be one if we're operating on a zvol, if the
2314          * objset doesn't exist yet, or is not mounted.
2315          */
2316         error = dmu_objset_open(zc->zc_name, DMU_OST_ANY, DS_MODE_USER, &os);
2317         if (error)
2318                 return (error);
2319
2320         if (dmu_objset_type(os) == DMU_OST_ZFS) {
2321                 mutex_enter(&os->os->os_user_ptr_lock);
2322                 zfsvfs = dmu_objset_get_user(os);
2323                 if (zfsvfs != NULL)
2324                         VFS_HOLD(zfsvfs->z_vfs);
2325                 mutex_exit(&os->os->os_user_ptr_lock);
2326         }
2327
2328         if (zfsvfs != NULL) {
2329                 char *osname;
2330                 int mode;
2331
2332                 osname = kmem_alloc(MAXNAMELEN, KM_SLEEP);
2333                 error = zfs_suspend_fs(zfsvfs, osname, &mode);
2334                 if (error == 0) {
2335                         int resume_err;
2336
2337                         ASSERT(strcmp(osname, zc->zc_name) == 0);
2338                         error = dmu_objset_rollback(os);
2339                         resume_err = zfs_resume_fs(zfsvfs, osname, mode);
2340                         error = error ? error : resume_err;
2341                 } else {
2342                         dmu_objset_close(os);
2343                 }
2344                 kmem_free(osname, MAXNAMELEN);
2345                 VFS_RELE(zfsvfs->z_vfs);
2346         } else {
2347                 error = dmu_objset_rollback(os);
2348         }
2349         /* Note, the dmu_objset_rollback() releases the objset for us. */
2350
2351         return (error);
2352 }
2353
2354 /*
2355  * inputs:
2356  * zc_name      old name of dataset
2357  * zc_value     new name of dataset
2358  * zc_cookie    recursive flag (only valid for snapshots)
2359  *
2360  * outputs:     none
2361  */
2362 static int
2363 zfs_ioc_rename(zfs_cmd_t *zc)
2364 {
2365         boolean_t recursive = zc->zc_cookie & 1;
2366
2367         zc->zc_value[sizeof (zc->zc_value) - 1] = '\0';
2368         if (dataset_namecheck(zc->zc_value, NULL, NULL) != 0 ||
2369             strchr(zc->zc_value, '%'))
2370                 return (EINVAL);
2371
2372         /*
2373          * Unmount snapshot unless we're doing a recursive rename,
2374          * in which case the dataset code figures out which snapshots
2375          * to unmount.
2376          */
2377         if (!recursive && strchr(zc->zc_name, '@') != NULL &&
2378             zc->zc_objset_type == DMU_OST_ZFS) {
2379                 int err = zfs_unmount_snap(zc->zc_name, NULL);
2380                 if (err)
2381                         return (err);
2382         }
2383         return (dmu_objset_rename(zc->zc_name, zc->zc_value, recursive));
2384 }
2385
2386 static void
2387 clear_props(char *dataset, nvlist_t *props)
2388 {
2389         zfs_cmd_t *zc;
2390         nvpair_t *prop;
2391
2392         if (props == NULL)
2393                 return;
2394         zc = kmem_alloc(sizeof (zfs_cmd_t), KM_SLEEP);
2395         (void) strcpy(zc->zc_name, dataset);
2396         for (prop = nvlist_next_nvpair(props, NULL); prop;
2397             prop = nvlist_next_nvpair(props, prop)) {
2398                 (void) strcpy(zc->zc_value, nvpair_name(prop));
2399                 if (zfs_secpolicy_inherit(zc, CRED()) == 0)
2400                         (void) zfs_ioc_inherit_prop(zc);
2401         }
2402         kmem_free(zc, sizeof (zfs_cmd_t));
2403 }
2404
2405 /*
2406  * inputs:
2407  * zc_name              name of containing filesystem
2408  * zc_nvlist_src{_size} nvlist of properties to apply
2409  * zc_value             name of snapshot to create
2410  * zc_string            name of clone origin (if DRR_FLAG_CLONE)
2411  * zc_cookie            file descriptor to recv from
2412  * zc_begin_record      the BEGIN record of the stream (not byteswapped)
2413  * zc_guid              force flag
2414  *
2415  * outputs:
2416  * zc_cookie            number of bytes read
2417  */
2418 static int
2419 zfs_ioc_recv(zfs_cmd_t *zc)
2420 {
2421         file_t *fp;
2422         objset_t *os;
2423         dmu_recv_cookie_t drc;
2424         zfsvfs_t *zfsvfs = NULL;
2425         boolean_t force = (boolean_t)zc->zc_guid;
2426         int error, fd;
2427         offset_t off;
2428         nvlist_t *props = NULL;
2429         nvlist_t *origprops = NULL;
2430         objset_t *origin = NULL;
2431         char *tosnap;
2432         char tofs[ZFS_MAXNAMELEN];
2433
2434         if (dataset_namecheck(zc->zc_value, NULL, NULL) != 0 ||
2435             strchr(zc->zc_value, '@') == NULL ||
2436             strchr(zc->zc_value, '%'))
2437                 return (EINVAL);
2438
2439         (void) strcpy(tofs, zc->zc_value);
2440         tosnap = strchr(tofs, '@');
2441         *tosnap = '\0';
2442         tosnap++;
2443
2444         if (zc->zc_nvlist_src != NULL &&
2445             (error = get_nvlist(zc->zc_nvlist_src, zc->zc_nvlist_src_size,
2446             &props)) != 0)
2447                 return (error);
2448
2449         fd = zc->zc_cookie;
2450         fp = getf(fd);
2451         if (fp == NULL) {
2452                 nvlist_free(props);
2453                 return (EBADF);
2454         }
2455
2456         if (dmu_objset_open(tofs, DMU_OST_ANY,
2457             DS_MODE_USER | DS_MODE_READONLY, &os) == 0) {
2458                 /*
2459                  * Try to get the zfsvfs for the receiving objset.
2460                  * There won't be one if we're operating on a zvol,
2461                  * if the objset doesn't exist yet, or is not mounted.
2462                  */
2463                 mutex_enter(&os->os->os_user_ptr_lock);
2464                 if (zfsvfs = dmu_objset_get_user(os)) {
2465                         if (!mutex_tryenter(&zfsvfs->z_online_recv_lock)) {
2466                                 mutex_exit(&os->os->os_user_ptr_lock);
2467                                 dmu_objset_close(os);
2468                                 zfsvfs = NULL;
2469                                 error = EBUSY;
2470                                 goto out;
2471                         }
2472                         VFS_HOLD(zfsvfs->z_vfs);
2473                 }
2474                 mutex_exit(&os->os->os_user_ptr_lock);
2475
2476                 /*
2477                  * If new properties are supplied, they are to completely
2478                  * replace the existing ones, so stash away the existing ones.
2479                  */
2480                 if (props)
2481                         (void) dsl_prop_get_all(os, &origprops, TRUE);
2482
2483                 dmu_objset_close(os);
2484         }
2485
2486         if (zc->zc_string[0]) {
2487                 error = dmu_objset_open(zc->zc_string, DMU_OST_ANY,
2488                     DS_MODE_USER | DS_MODE_READONLY, &origin);
2489                 if (error)
2490                         goto out;
2491         }
2492
2493         error = dmu_recv_begin(tofs, tosnap, &zc->zc_begin_record,
2494             force, origin, zfsvfs != NULL, &drc);
2495         if (origin)
2496                 dmu_objset_close(origin);
2497         if (error)
2498                 goto out;
2499
2500         /*
2501          * Reset properties.  We do this before we receive the stream
2502          * so that the properties are applied to the new data.
2503          */
2504         if (props) {
2505                 clear_props(tofs, origprops);
2506                 /*
2507                  * XXX - Note, this is all-or-nothing; should be best-effort.
2508                  */
2509                 (void) zfs_set_prop_nvlist(tofs, props);
2510         }
2511
2512         off = fp->f_offset;
2513         error = dmu_recv_stream(&drc, fp->f_vnode, &off);
2514
2515         if (error == 0 && zfsvfs) {
2516                 char *osname;
2517                 int mode;
2518
2519                 /* online recv */
2520                 osname = kmem_alloc(MAXNAMELEN, KM_SLEEP);
2521                 error = zfs_suspend_fs(zfsvfs, osname, &mode);
2522                 if (error == 0) {
2523                         int resume_err;
2524
2525                         error = dmu_recv_end(&drc);
2526                         resume_err = zfs_resume_fs(zfsvfs, osname, mode);
2527                         error = error ? error : resume_err;
2528                 } else {
2529                         dmu_recv_abort_cleanup(&drc);
2530                 }
2531                 kmem_free(osname, MAXNAMELEN);
2532         } else if (error == 0) {
2533                 error = dmu_recv_end(&drc);
2534         }
2535
2536         zc->zc_cookie = off - fp->f_offset;
2537         if (VOP_SEEK(fp->f_vnode, fp->f_offset, &off, NULL) == 0)
2538                 fp->f_offset = off;
2539
2540         /*
2541          * On error, restore the original props.
2542          */
2543         if (error && props) {
2544                 clear_props(tofs, props);
2545                 (void) zfs_set_prop_nvlist(tofs, origprops);
2546         }
2547 out:
2548         if (zfsvfs) {
2549                 mutex_exit(&zfsvfs->z_online_recv_lock);
2550                 VFS_RELE(zfsvfs->z_vfs);
2551         }
2552         nvlist_free(props);
2553         nvlist_free(origprops);
2554         releasef(fd);
2555         return (error);
2556 }
2557
2558 /*
2559  * inputs:
2560  * zc_name      name of snapshot to send
2561  * zc_value     short name of incremental fromsnap (may be empty)
2562  * zc_cookie    file descriptor to send stream to
2563  * zc_obj       fromorigin flag (mutually exclusive with zc_value)
2564  *
2565  * outputs: none
2566  */
2567 static int
2568 zfs_ioc_send(zfs_cmd_t *zc)
2569 {
2570         objset_t *fromsnap = NULL;
2571         objset_t *tosnap;
2572         file_t *fp;
2573         int error;
2574         offset_t off;
2575
2576         error = dmu_objset_open(zc->zc_name, DMU_OST_ANY,
2577             DS_MODE_USER | DS_MODE_READONLY, &tosnap);
2578         if (error)
2579                 return (error);
2580
2581         if (zc->zc_value[0] != '\0') {
2582                 char *buf;
2583                 char *cp;
2584
2585                 buf = kmem_alloc(MAXPATHLEN, KM_SLEEP);
2586                 (void) strncpy(buf, zc->zc_name, MAXPATHLEN);
2587                 cp = strchr(buf, '@');
2588                 if (cp)
2589                         *(cp+1) = 0;
2590                 (void) strncat(buf, zc->zc_value, MAXPATHLEN);
2591                 error = dmu_objset_open(buf, DMU_OST_ANY,
2592                     DS_MODE_USER | DS_MODE_READONLY, &fromsnap);
2593                 kmem_free(buf, MAXPATHLEN);
2594                 if (error) {
2595                         dmu_objset_close(tosnap);
2596                         return (error);
2597                 }
2598         }
2599
2600         fp = getf(zc->zc_cookie);
2601         if (fp == NULL) {
2602                 dmu_objset_close(tosnap);
2603                 if (fromsnap)
2604                         dmu_objset_close(fromsnap);
2605                 return (EBADF);
2606         }
2607
2608         off = fp->f_offset;
2609         error = dmu_sendbackup(tosnap, fromsnap, zc->zc_obj, fp->f_vnode, &off);
2610
2611         if (VOP_SEEK(fp->f_vnode, fp->f_offset, &off, NULL) == 0)
2612                 fp->f_offset = off;
2613         releasef(zc->zc_cookie);
2614         if (fromsnap)
2615                 dmu_objset_close(fromsnap);
2616         dmu_objset_close(tosnap);
2617         return (error);
2618 }
2619
2620 static int
2621 zfs_ioc_inject_fault(zfs_cmd_t *zc)
2622 {
2623         int id, error;
2624
2625         error = zio_inject_fault(zc->zc_name, (int)zc->zc_guid, &id,
2626             &zc->zc_inject_record);
2627
2628         if (error == 0)
2629                 zc->zc_guid = (uint64_t)id;
2630
2631         return (error);
2632 }
2633
2634 static int
2635 zfs_ioc_clear_fault(zfs_cmd_t *zc)
2636 {
2637         return (zio_clear_fault((int)zc->zc_guid));
2638 }
2639
2640 static int
2641 zfs_ioc_inject_list_next(zfs_cmd_t *zc)
2642 {
2643         int id = (int)zc->zc_guid;
2644         int error;
2645
2646         error = zio_inject_list_next(&id, zc->zc_name, sizeof (zc->zc_name),
2647             &zc->zc_inject_record);
2648
2649         zc->zc_guid = id;
2650
2651         return (error);
2652 }
2653
2654 static int
2655 zfs_ioc_error_log(zfs_cmd_t *zc)
2656 {
2657         spa_t *spa;
2658         int error;
2659         size_t count = (size_t)zc->zc_nvlist_dst_size;
2660
2661         if ((error = spa_open(zc->zc_name, &spa, FTAG)) != 0)
2662                 return (error);
2663
2664         error = spa_get_errlog(spa, (void *)(uintptr_t)zc->zc_nvlist_dst,
2665             &count);
2666         if (error == 0)
2667                 zc->zc_nvlist_dst_size = count;
2668         else
2669                 zc->zc_nvlist_dst_size = spa_get_errlog_size(spa);
2670
2671         spa_close(spa, FTAG);
2672
2673         return (error);
2674 }
2675
2676 static int
2677 zfs_ioc_clear(zfs_cmd_t *zc)
2678 {
2679         spa_t *spa;
2680         vdev_t *vd;
2681         int error;
2682
2683         /*
2684          * On zpool clear we also fix up missing slogs
2685          */
2686         mutex_enter(&spa_namespace_lock);
2687         spa = spa_lookup(zc->zc_name);
2688         if (spa == NULL) {
2689                 mutex_exit(&spa_namespace_lock);
2690                 return (EIO);
2691         }
2692         if (spa->spa_log_state == SPA_LOG_MISSING) {
2693                 /* we need to let spa_open/spa_load clear the chains */
2694                 spa->spa_log_state = SPA_LOG_CLEAR;
2695         }
2696         mutex_exit(&spa_namespace_lock);
2697
2698         if ((error = spa_open(zc->zc_name, &spa, FTAG)) != 0)
2699                 return (error);
2700
2701         spa_vdev_state_enter(spa);
2702
2703         if (zc->zc_guid == 0) {
2704                 vd = NULL;
2705         } else {
2706                 vd = spa_lookup_by_guid(spa, zc->zc_guid, B_TRUE);
2707                 if (vd == NULL) {
2708                         (void) spa_vdev_state_exit(spa, NULL, ENODEV);
2709                         spa_close(spa, FTAG);
2710                         return (ENODEV);
2711                 }
2712         }
2713
2714         vdev_clear(spa, vd);
2715
2716         (void) spa_vdev_state_exit(spa, NULL, 0);
2717
2718         /*
2719          * Resume any suspended I/Os.
2720          */
2721         zio_resume(spa);
2722
2723         spa_close(spa, FTAG);
2724
2725         return (0);
2726 }
2727
2728 /*
2729  * inputs:
2730  * zc_name      name of filesystem
2731  * zc_value     name of origin snapshot
2732  *
2733  * outputs:     none
2734  */
2735 static int
2736 zfs_ioc_promote(zfs_cmd_t *zc)
2737 {
2738         char *cp;
2739
2740         /*
2741          * We don't need to unmount *all* the origin fs's snapshots, but
2742          * it's easier.
2743          */
2744         cp = strchr(zc->zc_value, '@');
2745         if (cp)
2746                 *cp = '\0';
2747         (void) dmu_objset_find(zc->zc_value,
2748             zfs_unmount_snap, NULL, DS_FIND_SNAPSHOTS);
2749         return (dsl_dataset_promote(zc->zc_name));
2750 }
2751
2752 /*
2753  * We don't want to have a hard dependency
2754  * against some special symbols in sharefs
2755  * nfs, and smbsrv.  Determine them if needed when
2756  * the first file system is shared.
2757  * Neither sharefs, nfs or smbsrv are unloadable modules.
2758  */
2759 int (*znfsexport_fs)(void *arg);
2760 int (*zshare_fs)(enum sharefs_sys_op, share_t *, uint32_t);
2761 int (*zsmbexport_fs)(void *arg, boolean_t add_share);
2762
2763 int zfs_nfsshare_inited;
2764 int zfs_smbshare_inited;
2765
2766 ddi_modhandle_t nfs_mod;
2767 ddi_modhandle_t sharefs_mod;
2768 ddi_modhandle_t smbsrv_mod;
2769 kmutex_t zfs_share_lock;
2770
2771 static int
2772 zfs_init_sharefs()
2773 {
2774         int error;
2775
2776         ASSERT(MUTEX_HELD(&zfs_share_lock));
2777         /* Both NFS and SMB shares also require sharetab support. */
2778         if (sharefs_mod == NULL && ((sharefs_mod =
2779             ddi_modopen("fs/sharefs",
2780             KRTLD_MODE_FIRST, &error)) == NULL)) {
2781                 return (ENOSYS);
2782         }
2783         if (zshare_fs == NULL && ((zshare_fs =
2784             (int (*)(enum sharefs_sys_op, share_t *, uint32_t))
2785             ddi_modsym(sharefs_mod, "sharefs_impl", &error)) == NULL)) {
2786                 return (ENOSYS);
2787         }
2788         return (0);
2789 }
2790
2791 static int
2792 zfs_ioc_share(zfs_cmd_t *zc)
2793 {
2794         int error;
2795         int opcode;
2796
2797         switch (zc->zc_share.z_sharetype) {
2798         case ZFS_SHARE_NFS:
2799         case ZFS_UNSHARE_NFS:
2800                 if (zfs_nfsshare_inited == 0) {
2801                         mutex_enter(&zfs_share_lock);
2802                         if (nfs_mod == NULL && ((nfs_mod = ddi_modopen("fs/nfs",
2803                             KRTLD_MODE_FIRST, &error)) == NULL)) {
2804                                 mutex_exit(&zfs_share_lock);
2805                                 return (ENOSYS);
2806                         }
2807                         if (znfsexport_fs == NULL &&
2808                             ((znfsexport_fs = (int (*)(void *))
2809                             ddi_modsym(nfs_mod,
2810                             "nfs_export", &error)) == NULL)) {
2811                                 mutex_exit(&zfs_share_lock);
2812                                 return (ENOSYS);
2813                         }
2814                         error = zfs_init_sharefs();
2815                         if (error) {
2816                                 mutex_exit(&zfs_share_lock);
2817                                 return (ENOSYS);
2818                         }
2819                         zfs_nfsshare_inited = 1;
2820                         mutex_exit(&zfs_share_lock);
2821                 }
2822                 break;
2823         case ZFS_SHARE_SMB:
2824         case ZFS_UNSHARE_SMB:
2825                 if (zfs_smbshare_inited == 0) {
2826                         mutex_enter(&zfs_share_lock);
2827                         if (smbsrv_mod == NULL && ((smbsrv_mod =
2828                             ddi_modopen("drv/smbsrv",
2829                             KRTLD_MODE_FIRST, &error)) == NULL)) {
2830                                 mutex_exit(&zfs_share_lock);
2831                                 return (ENOSYS);
2832                         }
2833                         if (zsmbexport_fs == NULL && ((zsmbexport_fs =
2834                             (int (*)(void *, boolean_t))ddi_modsym(smbsrv_mod,
2835                             "smb_server_share", &error)) == NULL)) {
2836                                 mutex_exit(&zfs_share_lock);
2837                                 return (ENOSYS);
2838                         }
2839                         error = zfs_init_sharefs();
2840                         if (error) {
2841                                 mutex_exit(&zfs_share_lock);
2842                                 return (ENOSYS);
2843                         }
2844                         zfs_smbshare_inited = 1;
2845                         mutex_exit(&zfs_share_lock);
2846                 }
2847                 break;
2848         default:
2849                 return (EINVAL);
2850         }
2851
2852         switch (zc->zc_share.z_sharetype) {
2853         case ZFS_SHARE_NFS:
2854         case ZFS_UNSHARE_NFS:
2855                 if (error =
2856                     znfsexport_fs((void *)
2857                     (uintptr_t)zc->zc_share.z_exportdata))
2858                         return (error);
2859                 break;
2860         case ZFS_SHARE_SMB:
2861         case ZFS_UNSHARE_SMB:
2862                 if (error = zsmbexport_fs((void *)
2863                     (uintptr_t)zc->zc_share.z_exportdata,
2864                     zc->zc_share.z_sharetype == ZFS_SHARE_SMB ?
2865                     B_TRUE : B_FALSE)) {
2866                         return (error);
2867                 }
2868                 break;
2869         }
2870
2871         opcode = (zc->zc_share.z_sharetype == ZFS_SHARE_NFS ||
2872             zc->zc_share.z_sharetype == ZFS_SHARE_SMB) ?
2873             SHAREFS_ADD : SHAREFS_REMOVE;
2874
2875         /*
2876          * Add or remove share from sharetab
2877          */
2878         error = zshare_fs(opcode,
2879             (void *)(uintptr_t)zc->zc_share.z_sharedata,
2880             zc->zc_share.z_sharemax);
2881
2882         return (error);
2883
2884 }
2885
2886 /*
2887  * pool create, destroy, and export don't log the history as part of
2888  * zfsdev_ioctl, but rather zfs_ioc_pool_create, and zfs_ioc_pool_export
2889  * do the logging of those commands.
2890  */
2891 static zfs_ioc_vec_t zfs_ioc_vec[] = {
2892         { zfs_ioc_pool_create, zfs_secpolicy_config, POOL_NAME, B_FALSE },
2893         { zfs_ioc_pool_destroy, zfs_secpolicy_config, POOL_NAME, B_FALSE },
2894         { zfs_ioc_pool_import, zfs_secpolicy_config, POOL_NAME, B_TRUE },
2895         { zfs_ioc_pool_export, zfs_secpolicy_config, POOL_NAME, B_FALSE },
2896         { zfs_ioc_pool_configs, zfs_secpolicy_none, NO_NAME, B_FALSE },
2897         { zfs_ioc_pool_stats, zfs_secpolicy_read, POOL_NAME, B_FALSE },
2898         { zfs_ioc_pool_tryimport, zfs_secpolicy_config, NO_NAME, B_FALSE },
2899         { zfs_ioc_pool_scrub, zfs_secpolicy_config, POOL_NAME, B_TRUE },
2900         { zfs_ioc_pool_freeze, zfs_secpolicy_config, NO_NAME, B_FALSE },
2901         { zfs_ioc_pool_upgrade, zfs_secpolicy_config, POOL_NAME, B_TRUE },
2902         { zfs_ioc_pool_get_history, zfs_secpolicy_config, POOL_NAME, B_FALSE },
2903         { zfs_ioc_vdev_add, zfs_secpolicy_config, POOL_NAME, B_TRUE },
2904         { zfs_ioc_vdev_remove, zfs_secpolicy_config, POOL_NAME, B_TRUE },
2905         { zfs_ioc_vdev_set_state, zfs_secpolicy_config, POOL_NAME, B_TRUE },
2906         { zfs_ioc_vdev_attach, zfs_secpolicy_config, POOL_NAME, B_TRUE },
2907         { zfs_ioc_vdev_detach, zfs_secpolicy_config, POOL_NAME, B_TRUE },
2908         { zfs_ioc_vdev_setpath, zfs_secpolicy_config, POOL_NAME, B_FALSE },
2909         { zfs_ioc_objset_stats, zfs_secpolicy_read, DATASET_NAME, B_FALSE },
2910         { zfs_ioc_objset_zplprops, zfs_secpolicy_read, DATASET_NAME, B_FALSE },
2911         { zfs_ioc_dataset_list_next, zfs_secpolicy_read,
2912             DATASET_NAME, B_FALSE },
2913         { zfs_ioc_snapshot_list_next, zfs_secpolicy_read,
2914             DATASET_NAME, B_FALSE },
2915         { zfs_ioc_set_prop, zfs_secpolicy_none, DATASET_NAME, B_TRUE },
2916         { zfs_ioc_create_minor, zfs_secpolicy_minor, DATASET_NAME, B_FALSE },
2917         { zfs_ioc_remove_minor, zfs_secpolicy_minor, DATASET_NAME, B_FALSE },
2918         { zfs_ioc_create, zfs_secpolicy_create, DATASET_NAME, B_TRUE },
2919         { zfs_ioc_destroy, zfs_secpolicy_destroy, DATASET_NAME, B_TRUE },
2920         { zfs_ioc_rollback, zfs_secpolicy_rollback, DATASET_NAME, B_TRUE },
2921         { zfs_ioc_rename, zfs_secpolicy_rename, DATASET_NAME, B_TRUE },
2922         { zfs_ioc_recv, zfs_secpolicy_receive, DATASET_NAME, B_TRUE },
2923         { zfs_ioc_send, zfs_secpolicy_send, DATASET_NAME, B_TRUE },
2924         { zfs_ioc_inject_fault, zfs_secpolicy_inject, NO_NAME, B_FALSE },
2925         { zfs_ioc_clear_fault, zfs_secpolicy_inject, NO_NAME, B_FALSE },
2926         { zfs_ioc_inject_list_next, zfs_secpolicy_inject, NO_NAME, B_FALSE },
2927         { zfs_ioc_error_log, zfs_secpolicy_inject, POOL_NAME, B_FALSE },
2928         { zfs_ioc_clear, zfs_secpolicy_config, POOL_NAME, B_TRUE },
2929         { zfs_ioc_promote, zfs_secpolicy_promote, DATASET_NAME, B_TRUE },
2930         { zfs_ioc_destroy_snaps, zfs_secpolicy_destroy, DATASET_NAME, B_TRUE },
2931         { zfs_ioc_snapshot, zfs_secpolicy_snapshot, DATASET_NAME, B_TRUE },
2932         { zfs_ioc_dsobj_to_dsname, zfs_secpolicy_config, POOL_NAME, B_FALSE },
2933         { zfs_ioc_obj_to_path, zfs_secpolicy_config, NO_NAME, B_FALSE },
2934         { zfs_ioc_pool_set_props, zfs_secpolicy_config, POOL_NAME, B_TRUE },
2935         { zfs_ioc_pool_get_props, zfs_secpolicy_read, POOL_NAME, B_FALSE },
2936         { zfs_ioc_set_fsacl, zfs_secpolicy_fsacl, DATASET_NAME, B_TRUE },
2937         { zfs_ioc_get_fsacl, zfs_secpolicy_read, DATASET_NAME, B_FALSE },
2938         { zfs_ioc_iscsi_perm_check, zfs_secpolicy_iscsi,
2939             DATASET_NAME, B_FALSE },
2940         { zfs_ioc_share, zfs_secpolicy_share, DATASET_NAME, B_FALSE },
2941         { zfs_ioc_inherit_prop, zfs_secpolicy_inherit, DATASET_NAME, B_TRUE },
2942 };
2943
2944 static int
2945 zfsdev_ioctl(dev_t dev, int cmd, intptr_t arg, int flag, cred_t *cr, int *rvalp)
2946 {
2947         zfs_cmd_t *zc;
2948         uint_t vec;
2949         int error, rc;
2950
2951         if (getminor(dev) != 0)
2952                 return (zvol_ioctl(dev, cmd, arg, flag, cr, rvalp));
2953
2954         vec = cmd - ZFS_IOC;
2955         ASSERT3U(getmajor(dev), ==, ddi_driver_major(zfs_dip));
2956
2957         if (vec >= sizeof (zfs_ioc_vec) / sizeof (zfs_ioc_vec[0]))
2958                 return (EINVAL);
2959
2960         zc = kmem_zalloc(sizeof (zfs_cmd_t), KM_SLEEP);
2961
2962         error = xcopyin((void *)arg, zc, sizeof (zfs_cmd_t));
2963
2964         if (error == 0)
2965                 error = zfs_ioc_vec[vec].zvec_secpolicy(zc, cr);
2966
2967         /*
2968          * Ensure that all pool/dataset names are valid before we pass down to
2969          * the lower layers.
2970          */
2971         if (error == 0) {
2972                 zc->zc_name[sizeof (zc->zc_name) - 1] = '\0';
2973                 switch (zfs_ioc_vec[vec].zvec_namecheck) {
2974                 case POOL_NAME:
2975                         if (pool_namecheck(zc->zc_name, NULL, NULL) != 0)
2976                                 error = EINVAL;
2977                         break;
2978
2979                 case DATASET_NAME:
2980                         if (dataset_namecheck(zc->zc_name, NULL, NULL) != 0)
2981                                 error = EINVAL;
2982                         break;
2983
2984                 case NO_NAME:
2985                         break;
2986                 }
2987         }
2988
2989         if (error == 0)
2990                 error = zfs_ioc_vec[vec].zvec_func(zc);
2991
2992         rc = xcopyout(zc, (void *)arg, sizeof (zfs_cmd_t));
2993         if (error == 0) {
2994                 error = rc;
2995                 if (zfs_ioc_vec[vec].zvec_his_log == B_TRUE)
2996                         zfs_log_history(zc);
2997         }
2998
2999         kmem_free(zc, sizeof (zfs_cmd_t));
3000         return (error);
3001 }
3002
3003 static int
3004 zfs_attach(dev_info_t *dip, ddi_attach_cmd_t cmd)
3005 {
3006         if (cmd != DDI_ATTACH)
3007                 return (DDI_FAILURE);
3008
3009         if (ddi_create_minor_node(dip, "zfs", S_IFCHR, 0,
3010             DDI_PSEUDO, 0) == DDI_FAILURE)
3011                 return (DDI_FAILURE);
3012
3013         zfs_dip = dip;
3014
3015         ddi_report_dev(dip);
3016
3017         return (DDI_SUCCESS);
3018 }
3019
3020 static int
3021 zfs_detach(dev_info_t *dip, ddi_detach_cmd_t cmd)
3022 {
3023         if (spa_busy() || zfs_busy() || zvol_busy())
3024                 return (DDI_FAILURE);
3025
3026         if (cmd != DDI_DETACH)
3027                 return (DDI_FAILURE);
3028
3029         zfs_dip = NULL;
3030
3031         ddi_prop_remove_all(dip);
3032         ddi_remove_minor_node(dip, NULL);
3033
3034         return (DDI_SUCCESS);
3035 }
3036
3037 /*ARGSUSED*/
3038 static int
3039 zfs_info(dev_info_t *dip, ddi_info_cmd_t infocmd, void *arg, void **result)
3040 {
3041         switch (infocmd) {
3042         case DDI_INFO_DEVT2DEVINFO:
3043                 *result = zfs_dip;
3044                 return (DDI_SUCCESS);
3045
3046         case DDI_INFO_DEVT2INSTANCE:
3047                 *result = (void *)0;
3048                 return (DDI_SUCCESS);
3049         }
3050
3051         return (DDI_FAILURE);
3052 }
3053
3054 /*
3055  * OK, so this is a little weird.
3056  *
3057  * /dev/zfs is the control node, i.e. minor 0.
3058  * /dev/zvol/[r]dsk/pool/dataset are the zvols, minor > 0.
3059  *
3060  * /dev/zfs has basically nothing to do except serve up ioctls,
3061  * so most of the standard driver entry points are in zvol.c.
3062  */
3063 static struct cb_ops zfs_cb_ops = {
3064         zvol_open,      /* open */
3065         zvol_close,     /* close */
3066         zvol_strategy,  /* strategy */
3067         nodev,          /* print */
3068         zvol_dump,      /* dump */
3069         zvol_read,      /* read */
3070         zvol_write,     /* write */
3071         zfsdev_ioctl,   /* ioctl */
3072         nodev,          /* devmap */
3073         nodev,          /* mmap */
3074         nodev,          /* segmap */
3075         nochpoll,       /* poll */
3076         ddi_prop_op,    /* prop_op */
3077         NULL,           /* streamtab */
3078         D_NEW | D_MP | D_64BIT,         /* Driver compatibility flag */
3079         CB_REV,         /* version */
3080         nodev,          /* async read */
3081         nodev,          /* async write */
3082 };
3083
3084 static struct dev_ops zfs_dev_ops = {
3085         DEVO_REV,       /* version */
3086         0,              /* refcnt */
3087         zfs_info,       /* info */
3088         nulldev,        /* identify */
3089         nulldev,        /* probe */
3090         zfs_attach,     /* attach */
3091         zfs_detach,     /* detach */
3092         nodev,          /* reset */
3093         &zfs_cb_ops,    /* driver operations */
3094         NULL,           /* no bus operations */
3095         NULL,           /* power */
3096         ddi_quiesce_not_needed, /* quiesce */
3097 };
3098
3099 static struct modldrv zfs_modldrv = {
3100         &mod_driverops,
3101         "ZFS storage pool",
3102         &zfs_dev_ops
3103 };
3104
3105 static struct modlinkage modlinkage = {
3106         MODREV_1,
3107         (void *)&zfs_modlfs,
3108         (void *)&zfs_modldrv,
3109         NULL
3110 };
3111
3112
3113 uint_t zfs_fsyncer_key;
3114 extern uint_t rrw_tsd_key;
3115
3116 int
3117 _init(void)
3118 {
3119         int error;
3120
3121         spa_init(FREAD | FWRITE);
3122         zfs_init();
3123         zvol_init();
3124
3125         if ((error = mod_install(&modlinkage)) != 0) {
3126                 zvol_fini();
3127                 zfs_fini();
3128                 spa_fini();
3129                 return (error);
3130         }
3131
3132         tsd_create(&zfs_fsyncer_key, NULL);
3133         tsd_create(&rrw_tsd_key, NULL);
3134
3135         error = ldi_ident_from_mod(&modlinkage, &zfs_li);
3136         ASSERT(error == 0);
3137         mutex_init(&zfs_share_lock, NULL, MUTEX_DEFAULT, NULL);
3138
3139         return (0);
3140 }
3141
3142 int
3143 _fini(void)
3144 {
3145         int error;
3146
3147         if (spa_busy() || zfs_busy() || zvol_busy() || zio_injection_enabled)
3148                 return (EBUSY);
3149
3150         if ((error = mod_remove(&modlinkage)) != 0)
3151                 return (error);
3152
3153         zvol_fini();
3154         zfs_fini();
3155         spa_fini();
3156         if (zfs_nfsshare_inited)
3157                 (void) ddi_modclose(nfs_mod);
3158         if (zfs_smbshare_inited)
3159                 (void) ddi_modclose(smbsrv_mod);
3160         if (zfs_nfsshare_inited || zfs_smbshare_inited)
3161                 (void) ddi_modclose(sharefs_mod);
3162
3163         tsd_destroy(&zfs_fsyncer_key);
3164         ldi_ident_release(zfs_li);
3165         zfs_li = NULL;
3166         mutex_destroy(&zfs_share_lock);
3167
3168         return (error);
3169 }
3170
3171 int
3172 _info(struct modinfo *modinfop)
3173 {
3174         return (mod_info(&modlinkage, modinfop));
3175 }