]> pd.if.org Git - zpackage/blob - db.sql
general search improvements
[zpackage] / db.sql
1 begin;
2
3 PRAGMA application_id = 0x5a504442;
4 PRAGMA user_version = 1;
5
6 -- should be faster with rowid due to the blob content
7 -- these are really just blobs of data
8 -- TODO copyright and license information should probably
9 -- go here
10 CREATE TABLE files (
11         hash text primary key, -- sha256 of content
12         size integer, -- bigint?  certainly need > 2GB
13         compression text, -- always xz?
14         content blob
15 )
16 ;
17
18 create view filerefs as
19 select F.hash,
20 count(PF.hash) + count(S.hash) + count(EL.file) + count(N.file) as refcount
21 from files F
22 left join packagefiles PF on PF.hash = F.hash
23 left join scripts S on S.hash = F.hash
24 left join elflibraries EL on EL.file = F.hash
25 left join notes N on N.file = F.hash
26 group by F.hash
27 ;
28
29 -- information about packages
30 -- a package is identified by a package,version,release triple
31 create table packages (
32         -- primary key columns
33         package text not null,
34         version text not null, -- the upstream version string
35         release integer not null, -- the local release number
36
37         -- metadata columns
38         description     text,
39         architecture    text,
40         url     text,
41         status  text,
42         licenses        text, -- hash of actual license?  need table for more than one?
43         packager        text,
44         build_time      integer default (strftime('%s', 'now')),
45         install_time    integer,
46         hash    text, -- see integ.c for package hash details
47         primary key (package,version,release),
48         check (typeof(package) = 'text'),
49         check (typeof(version) = 'text'),
50         check (typeof(release) = 'integer'),
51         check (release > 0),
52         -- enforce name and version conventions
53         check(instr(package,' ') = 0),
54         check(instr(package,'/') = 0),
55         check(instr(package,':') = 0),
56         check(instr(version,' ') = 0),
57         check(instr(version,'-') = 0),
58         check(instr(version,'/') = 0),
59         check(instr(version,':') = 0),
60         check(length(package) < 64),
61         check(length(package) > 0),
62         check(length(version) < 32),
63         check(length(version) > 0)
64 )
65 without rowid
66 ;
67
68 create index package_status_index on packages (status);
69 create index package_package_index on packages (package);
70
71 create view packages_pkgid as
72 select printf('%s-%s-%s', package, version, release) as pkgid, *
73 from packages;
74
75 create trigger packages_delete_trigger instead of
76 delete on packages_pkgid
77 begin
78         delete from packages where package = OLD.package
79         and version = OLD.version and release = OLD.release;
80 end;
81
82 create trigger packages_update_trigger instead of
83 update on packages_pkgid
84 begin
85         update packages
86         set package = NEW.package,
87         version = NEW.version,
88         release = NEW.release,
89         description = NEW.description,
90         architecture = NEW.architecture,
91         url = NEW.url,
92         status = NEW.status,
93         licenses = NEW.licenses,
94         packager = NEW.packager,
95         build_time = NEW.build_time,
96         install_time = NEW.install_time,
97         hash = NEW.hash
98         where package = OLD.package
99         and version = OLD.version
100         and release = OLD.release
101         ;
102 end
103 ;
104
105 -- handle package status history with a logging trigger.
106 create trigger logpkgstatus after update of status on packages
107 begin insert into zpmlog (action,target,info)
108         values (printf('status change %s %s', OLD.status, NEW.status),
109                 printf('%s-%s-%s', NEW.package, NEW.version, NEW.release),
110                 NULL); END;
111
112 create table packagetags (
113         -- package id triple
114         package text,
115         version text,
116         release integer,
117         tag     text,
118         set_time integer default (strftime('%s', 'now')),
119         primary key (package,version,release,tag),
120         foreign key (package,version,release) references packages (package,version,release) on delete cascade on update cascade
121 );
122
123 -- files contained in a package
124 create table packagefiles (
125         -- package id triple
126         package text,
127         version text,
128         release integer,
129
130         path    text, -- filesystem path
131         mode    text not null default '0644', -- perms, use text for octal rep?
132         username        text not null default 'root', -- name of owner
133         groupname       text not null default 'root', -- group of owner
134         uid     integer, -- numeric uid, generally ignored
135         gid     integer, -- numeric gid, generally ignored
136         configuration integer not null default 0, -- boolean if config file
137         confhash text, -- last hash on disk
138         filetype varchar not null default 'r',
139         -- r regular file
140         -- d directory
141         -- l symlink
142         -- h hard link -- not supported
143         -- c character special -- not supported
144         -- b block special -- not supported
145         -- c and b device special files add dev number column
146         -- p fifos (i.e. pipe) -- not supported
147         -- s unix domain socket -- not supported
148         target  text, -- link target for links
149         device  integer, -- device file dev_t
150         hash    text, -- null if not a regular file
151         mtime   integer, -- seconds since epoch, finer resolution not needed
152         primary key (package,version,release,path),
153         foreign key (package,version,release)
154                 references packages (package,version,release)
155                 on delete cascade on update cascade,
156         check (not (filetype = 'l' and target is null)),
157         check (not (filetype = 'h' and target is null)),
158         check (target is null or length(target) between 1 and 4095),
159         check (hash is null or length(hash) between 1 and 1024),
160         check (not (filetype = 'r' and hash is null)),
161         check (not (filetype = 'c' and device is null)),
162         check (not (filetype = 'b' and device is null)),
163         check (filetype in ('r','d','l','h','c','b','p')),
164         check(length(username) between 1 and 256),
165         check(length(groupname) between 1 and 256),
166         check (configuration = 0 or configuration = 1)
167 )
168 without rowid
169 ;
170
171 create index packagefile_package_index on packagefiles (package);
172 create index packagefile_path_index on packagefiles (path);
173 create index packagefile_hash_index on packagefiles (hash);
174
175 create view packagefiles_pkgid as
176 select printf('%s-%s-%s', package, version, release) as pkgid, *,
177 printf('%s:%s:%s:%s', filetype, mode, username, groupname) as mds
178 from packagefiles
179 ;
180
181 create trigger packagefiles_update_trigger instead of
182 update on packagefiles_pkgid
183 begin
184         update packagefiles
185         set package = NEW.package,
186         version = NEW.version,
187         release = NEW.release,
188         path = NEW.path,
189         mode = NEW.mode,
190         username = NEW.username,
191         groupname = NEW.groupname,
192         uid = NEW.uid,
193         gid = NEW.gid,
194         configuration = NEW.configuration,
195         filetype = NEW.filetype,
196         target = NEW.target,
197         device = NEW.device,
198         hash = NEW.hash,
199         mtime = NEW.mtime
200         where package = OLD.package
201         and version = OLD.version
202         and release = OLD.release
203         and path = OLD.path
204         ;
205 end
206 ;
207
208 create trigger packagefiles_delete_trigger instead of
209 delete on packagefiles_pkgid
210 begin
211         delete from packagefiles
212         where package = OLD.package
213         and version = OLD.version
214         and release = OLD.release
215         and path = OLD.path
216         ;
217         update packages set hash = null
218         where package = OLD.package
219         and version = OLD.version
220         and release = OLD.release
221         ;
222 end
223 ;
224
225 create view installed_ref_count as
226 select I.path, count(*) as refcount
227 from installedfiles I
228 group by I.path
229 ;
230
231 create view sync_status_ref_count as
232 select path, status, count(*) as refcount
233 from packagefiles_status
234 where status in ('installed', 'installing', 'removing')
235 group by path, status
236 ;
237
238 create view packagefiles_status as
239 select P.status, PF.*
240 from packagefiles_pkgid PF
241 left join packages_pkgid P on P.pkgid = PF.pkgid
242 ;
243
244 create view installedfiles as
245 select * from packagefiles_status
246 where status = 'installed'
247 ;
248
249 create table pathtags (
250         -- package id triple
251         package text,
252         version text,
253         release integer,
254
255         path    text, -- filesystem path
256         tag     text,
257         primary key (package,version,release,path,tag),
258         foreign key (package,version,release,path)
259         references packagefiles on delete cascade on update cascade
260 )
261 without rowid
262 ;
263
264 create view elfdeps as
265 select PF.pkgid, PF.status, PF.path, N.needed as needs,
266 PL.path as library, PL.pkgid provider, PL.status as library_status
267 from packagefiles_status PF
268 join elfneeded N on N.file = PF.hash
269 left join elflibraries L on N.needed = L.soname
270 left join packagefiles_status PL on PL.hash = L.file
271 ;
272
273 -- TODO just elf information?
274 -- and just hash, not package?
275 create table elflibraries (
276         file    text primary key,
277         soname  text
278 )
279 without rowid
280 ;
281
282 create table elfneeded (
283         file    text, -- hash of file
284         needed  text, -- soname of dependency
285         primary key (file, needed)
286 )
287 without rowid
288 ;
289
290 -- package scripts: table of package, stage, file
291 create table scripts (
292         package text,
293         version text,
294         release integer,
295         stage   text,
296         hash    text,
297         primary key (package,version,release,stage),
298         foreign key (package,version,release) references packages (package,version,release) on delete cascade on update cascade
299 );
300
301 create view scripts_pkgid as
302 select printf('%s-%s-%s', package, version, release) as pkgid, *
303 from scripts
304 ;
305
306 -- package dependencies: table of package, dependency, dep type (package, soname)
307 create table packagedeps (
308         package text,
309         version text,
310         release integer,
311         requires text, -- package name (only)
312         minimum text,
313         maximum text,
314         primary key (package,version,release,package),
315         foreign key (package,version,release) references packages (package,version,release) on delete cascade on update cascade
316 );
317
318 -- capability labels
319 create table provides (
320         package text,
321         subpackage      text,
322         label   text -- a capability label
323 );
324
325 create table requires (
326         package text,
327         subpackage      text,
328         label   text -- a capability label
329 );
330
331 create table packagegroups (
332         package text,
333         "group" text
334 );
335
336 -- zpm actions
337 -- not sure how machine readable this needs to be,
338 -- do not at all for now, figure it out later
339 -- could be worth logging all commands in a history table,
340 -- the zpm driver could do that and capture the exit status
341 -- as well
342 -- might want the history table to note a "group" to tie together
343 -- sub-invocations, probably an environment variable set if not
344 -- already set by zpm, probably a uuid or a timestamp
345 create table zpmlog (
346         ts      text default (strftime('%Y-%m-%d %H:%M:%f', 'now')),
347         -- timestamp of action
348         action  text,
349         target  text, -- packagename, repo name, etc
350         info    text -- human readable
351 );
352
353 create table notes (
354         id      integer primary key, -- rowid alias
355         ts      text default (strftime('%Y-%m-%d %H:%M:%f', 'now')),
356         note    text not null,
357         pkgid   text, -- package
358         path    text, -- file path involved
359         file    text, -- hash of file
360         ack     integer default 0
361 );
362
363 create table history (
364         ts      integer, -- again, probably needs timestamp sub second
365         cmd     text,
366         args    text,
367         status  integer
368 );
369
370 create table repository (
371         name    text primary key, -- our name for a repo
372         url     text not null,
373         priority        integer not null default 1,
374         refreshed       integer -- last refresh time
375 );
376
377 -- urls for downloading packages.  possibly unneeded
378 create table repository_packages (
379         repo    text,
380         pkg     text, -- glob pattern?  in which case others not needed
381         version text,
382         release text,
383         url     text
384 );
385
386 -- track which repository a package was cloned from, i.e. where we got it
387 create table packagesource (
388         name    text,
389         version text,
390         release integer,
391         repository      text references repository
392 );
393
394 create view syncconflicts as
395 with
396 preserved as (
397         select BASE.*, 'preserved' as rstatus
398         from packagefiles_status BASE
399         join elflibraries EL on EL.file = BASE.hash
400         where
401         BASE.status in ('removed', 'updated')
402         and BASE.hash in (select hash from packagefiles_status where
403                 status in ('installed'))
404 ),
405 syncstatus as (
406         select distinct BASE.*,
407         case when P.status = 'installing' and BASE.status = 'installed'
408                 then 'updating'
409         when BASE.status in ('removed','updated')
410                 and BASE.path in (select path from preserved) then
411                 'preserved'
412         else
413                 BASE.status
414         end as rstatus
415         from packagefiles_status BASE
416         left join packages P on P.package = BASE.package
417                 and BASE.status in ('installed', 'removing')
418                 and P.status = 'installing'
419 ),
420 -- metadata different
421 md_conflict as (
422         select path, count(distinct mds) as mdcount,
423         count(distinct hash) as hashcount
424         from syncstatus SS
425         where SS.rstatus in ('installing', 'installed')
426         group by path
427         having (count(distinct mds) > 1 or count(distinct hash) > 1)
428 )
429 select BASE.*, 'hash' as conflict
430 from syncstatus BASE
431 where path in (select path from md_conflict where hashcount > 1)
432 union
433 select BASE.*, 'md' as conflict
434 from syncstatus BASE
435 where path in (select path from md_conflict where mdcount > 1)
436 ;
437
438 create view needed_libraries as
439 with recursive
440 libs(file,needs,provider) as (
441         select N.file, N.needed as needs, L.file as provider
442         from elfneeded N left join elflibraries L on N.needed = L.soname
443         union
444         select L.file, N.needed as needs, EL.file as provider
445         from libs L
446         join elfneeded N on N.file = L.provider
447         left join elflibraries EL on N.needed = EL.soname
448 )
449 select * from libs;
450
451 create view syncinfo as
452 with
453 preserved as (
454         select BASE.*, 'preserved' as rstatus
455         from packagefiles_status BASE
456         join elflibraries EL on EL.file = BASE.hash
457         where
458         BASE.status in ('removed', 'updated')
459         and BASE.hash in (select hash from packagefiles_status where
460                 status in ('installed'))
461 ),
462 syncstatus as (
463         select distinct BASE.*,
464         case when P.status = 'installing' and BASE.status = 'installed'
465                 then 'updating'
466         when BASE.status in ('removed','updated')
467                 and BASE.path in (select path from preserved) then
468                 'preserved'
469         else
470                 BASE.status
471         end as rstatus
472         from packagefiles_status BASE
473         left join packages P on P.package = BASE.package
474                 and BASE.status in ('installed', 'removing')
475                 and P.status = 'installing'
476 ),
477 -- new file: in installing, not in installed or updating or removing
478 newfiles as (
479         select distinct
480         path,username,uid,groupname,gid,mode,filetype,mtime,hash,
481         configuration,target,device, null as ohash
482         from syncstatus SS
483         where path not in (select path from syncstatus where
484                 rstatus in ('installed', 'updating', 'removing')
485         )
486         and rstatus in ('installing')
487 ),
488 -- modified: retained, but with different metadata
489 modified as (
490         select distinct
491         SS.path, 
492         SS.username, SS.uid, SS.groupname, SS.gid, SS.mode, SS.filetype,
493         SS.mtime, SS.hash,
494         SS.configuration + case when OS.configuration = 1 then 2 else 0 end
495         as configuration,
496         SS.target, SS.device,
497         OS.hash as ohash, SS.mds, OS.mds as omds
498         from syncstatus SS
499         join syncstatus OS
500         on SS.path = OS.path and SS.pkgid is not OS.pkgid
501         -- preserved?
502         and OS.rstatus in ('installed','updating','removing')
503         and (SS.mds is not OS.mds or SS.hash is not OS.hash)
504         where
505         SS.rstatus in ('installing')
506 ),
507 -- preserve: libraries needed by something in installed or installing
508 /*
509 needed as (
510         select distinct
511         ED.library
512         from elfdeps ED
513         where status in ('installed', 'installing')
514         and library is not null
515 ),
516 */
517 needed as (
518         select NL.file as needslib, NL.provider as libraryhash
519         from needed_libraries NL
520         inner join syncstatus SS on SS.hash = NL.file
521         and SS.status in ('installed', 'installing')
522 ),
523 preserve as (
524         select distinct
525         path,username,uid,groupname,gid,mode,filetype,mtime,hash,
526         configuration,target,device, null as ohash
527         from syncstatus SS
528         join needed N on SS.hash = N.libraryhash
529         where SS.rstatus in ('removing', 'removed')
530 --      where SS.hash in (select libraryhash from needed)
531 --      where path in (select library from needed)
532 --      and SS.rstatus in ('removing', 'removed')
533 ),
534 -- remove: cur, not preserved, not in final set
535 remove as (
536         select distinct
537         path,username,uid,groupname,gid,mode,filetype,mtime,hash,
538         configuration,target,device, null as ohash
539         from syncstatus SS
540         where path not in (
541                 select path from syncstatus where
542                 rstatus in ('installed', 'installing')
543         )
544         and path not in (select path from preserve)
545         and rstatus in ('removing', 'updating')
546 ),
547 -- expired: libraries that had been preserved, but aren't needed now
548 expired as (
549         select distinct
550         path,username,uid,groupname,gid,mode,filetype,mtime,hash,
551         configuration,target,device, null as ohash
552         from syncstatus BASE
553         where hash in (select file from elflibraries where file is not null)
554         and path not in (select path from preserve)
555         and rstatus in ('removed','updated')
556 )
557 select 'update' as op, *
558 ,(select group_concat(pkgid, ' ')
559         from syncstatus SS
560         where SS.rstatus = 'installing' and SS.path = M.path
561 ) as pkglist
562 from modified M
563 union
564 select 'remove' as op, *, null, null, null from remove
565 union
566 select 'obsolete' as op, *, null, null, null from expired
567 union
568 select 'new' as op, *, null, null, null from newfiles
569 union
570 select 'preserve' as op, *, null, null, null from preserve
571 ;
572
573 commit;