Fix #477: similarity duplicate search
[geeqie.git] / doc / docbook / GuideImageSearchFindingDuplicates.xml
1 <?xml version="1.0" encoding="utf-8"?>\r
2 <section id="GuideImageSearchFindingDuplicates">\r
3   <title id="titleGuideImageSearchFindingDuplicates">Finding Duplicates</title>\r
4   <para>Geeqie provides a utility to find images that have similar attributes or content.</para>\r
5   <para>\r
6     To display a new Find Duplicates Window select\r
7     <menuchoice>\r
8       <guimenu>File</guimenu>\r
9       <guimenuitem>Find duplicates</guimenuitem>\r
10     </menuchoice>\r
11     .\r
12   </para>\r
13   <section id="Addingfilestobecompared">\r
14     <title>Adding files to be compared</title>\r
15     <para>Add files to be compared using drag and drop. Drop files or folders onto the Find Duplicates window to add them to the list of files to compare. When one or more folders are dropped onto the window a menu will appear allowing you to choose the desired action:</para>\r
16     <variablelist>\r
17       <varlistentry>\r
18         <term>\r
19           <guilabel>Add contents</guilabel>\r
20         </term>\r
21         <listitem>The contents of dropped folders will added to the window.</listitem>\r
22       </varlistentry>\r
23       <varlistentry>\r
24         <term>\r
25           <guilabel>Add contents recursive</guilabel>\r
26         </term>\r
27         <listitem>The contents of dropped folders and all sub folders will be added to the window.</listitem>\r
28       </varlistentry>\r
29       <varlistentry>\r
30         <term>\r
31           <guilabel>Skip folders</guilabel>\r
32         </term>\r
33         <listitem>\r
34           Ignore folders contained in the drop list.\r
35           <para />\r
36           When files are added to the window, the comparison is restarted to include the new files.\r
37         </listitem>\r
38       </varlistentry>\r
39     </variablelist>\r
40   </section>\r
41   <section id="Comparisonmethods">\r
42     <title>Comparison methods</title>\r
43     <para>\r
44       The attribute to use for two images to match can be selected with the\r
45       <emphasis role="bold">Compare by:</emphasis>\r
46       drop down menu. Each method is explained below:\r
47     </para>\r
48     <variablelist>\r
49       <varlistentry>\r
50         <term>\r
51           <guilabel>Name</guilabel>\r
52         </term>\r
53         <listitem>\r
54           <para>The file name.</para>\r
55         </listitem>\r
56       </varlistentry>\r
57       <varlistentry>\r
58         <term>\r
59           <guilabel>Name case-insensitive</guilabel>\r
60         </term>\r
61         <listitem>\r
62           <para>The file name but ignoring case.</para>\r
63         </listitem>\r
64       </varlistentry>\r
65       <varlistentry>\r
66         <term>\r
67           <guilabel>Size</guilabel>\r
68         </term>\r
69         <listitem>\r
70           <para>The file size.</para>\r
71         </listitem>\r
72       </varlistentry>\r
73       <varlistentry>\r
74         <term>\r
75           <guilabel>Date</guilabel>\r
76         </term>\r
77         <listitem>\r
78           <para>The file date.</para>\r
79         </listitem>\r
80       </varlistentry>\r
81       <varlistentry>\r
82         <term>\r
83           <guilabel>Dimensions</guilabel>\r
84         </term>\r
85         <listitem>\r
86           <para>The image dimensions.</para>\r
87         </listitem>\r
88       </varlistentry>\r
89       <varlistentry>\r
90         <term>\r
91           <guilabel>Checksum</guilabel>\r
92         </term>\r
93         <listitem>\r
94           <para>The MD5 file checksum.</para>\r
95         </listitem>\r
96       </varlistentry>\r
97       <varlistentry>\r
98         <term>\r
99           <guilabel>Path</guilabel>\r
100         </term>\r
101         <listitem>\r
102           <para>The complete path to file.</para>\r
103         </listitem>\r
104       </varlistentry>\r
105       <varlistentry>\r
106         <term>\r
107           <guilabel>Similarity (high)</guilabel>\r
108         </term>\r
109         <listitem>\r
110           <para>Very similar image content.</para>\r
111         </listitem>\r
112       </varlistentry>\r
113       <varlistentry>\r
114         <term>\r
115           <guilabel>Similarity</guilabel>\r
116         </term>\r
117         <listitem>\r
118           <para>Similar image content.</para>\r
119         </listitem>\r
120       </varlistentry>\r
121       <varlistentry>\r
122         <term>\r
123           <guilabel>Similarity (low)</guilabel>\r
124         </term>\r
125         <listitem>\r
126           <para>Slightly similar image content.</para>\r
127         </listitem>\r
128       </varlistentry>\r
129       <varlistentry>\r
130         <term>\r
131           <guilabel>Similarity (custom)</guilabel>\r
132         </term>\r
133         <listitem>\r
134           <para>\r
135             The percentage value to used to consider two images a match is configured in the spin box at the bottom of the window.\r
136           </para>\r
137         </listitem>\r
138       </varlistentry>\r
139     </variablelist>\r
140   </section>\r
141   <section id="Resultslist">\r
142     <title>Results list</title>\r
143     <para>Files that match with the selected comparison method will appear in the list. Matching files are grouped in alternating color.</para>\r
144     <para>The order of the result list can not be changed, files will appear in the order of the search. When comparing by image content similarity, the matching groups will be sorted by order of rank starting with the files that are most similar.</para>\r
145     <para>\r
146       A\r
147       <emphasis role="strong">context menu</emphasis>\r
148       is available for the result list by right clicking the mouse or pressing the Menu key when a row has the focus.\r
149     </para>\r
150     <para>\r
151       Groups in the results list may be selected by using the keyboard. Refer to the <emphasis>Find Duplicates Window</emphasis> section of\r
152        <link linkend="FindDuplicatesWindow" >Keyboard Shortcuts</link>\r
153       .\r
154     </para>\r
155     <para>\r
156       The\r
157       <emphasis role="strong">selection</emphasis>\r
158       can be changed using the keyboard and mouse the same as in a\r
159       <link linkend="GuideMainWindowFilePane">file pane</link>\r
160       of the main window.\r
161     </para>\r
162     <para>The image Dimensions column of the result list will only contain dimension information when comparing by dimensions, or when the data is easily available from memory or has been read from the cache.</para>\r
163   </section>\r
164   <section id="Statusbar">\r
165     <title>Status bar</title>\r
166     <para>Along the bottom of the Find Duplicates window is an area that displays the count of files contained in the window, and the number of files in the result list.</para>\r
167     <para>The status bar will also display the status of an active compare operation using the progress bar. A compare operation involves 2 or 3 stages, depending on the type of comparison. These are the stages in order:</para>\r
168     <orderedlist>\r
169       <listitem>\r
170         <para>If necessary, extra data is read into memory for the comparison stage and the progress bar will indicate this stage with text such as “Reading dimensions...”, “Reading checksums...”, or “Reading similarity data...”.</para>\r
171       </listitem>\r
172       <listitem>The images are compared using the selected method, the progress bar will indicate this stage with the text “Comparing...”.</listitem>\r
173       <listitem>\r
174         <para>The results are sorted for display, the progress bar will indicate this stage with the text “Sorting...”.</para>\r
175         <para>Stage 1 is only used for the Dimensions, Checksum, and Similarity compare methods.</para>\r
176         <para>If the time to complete a stage will be significant, an estimated time to completion will also be displayed in the progress bar. The estimated time only refers to the current stage, other stages are not included in the estimate. The time estimate is displayed using the format MINUTES:SECONDS.</para>\r
177       </listitem>\r
178     </orderedlist>\r
179   </section>\r
180   <section id="Thumbnails">\r
181     <title>Thumbnails</title>\r
182     <para>Thumbnails can be displayed beside each image in the result list by enabling the Thumbnails check box.</para>\r
183   </section>\r
184   <section id="Rotation">\r
185     <title>Ignore Rotation</title>\r
186     <para>When checked, the rotational orientation of images will be ignored.</para>\r
187   </section>\r
188   <section id="Sort">\r
189     <title>Sort</title>\r
190     <para>\r
191       The normal sort order is for groups (in the case of Similarity checks) with the highest number of near-100% matches to be at the top of the list.\r
192       <para />\r
193       If this box is checked, groups with the lowest number of matches are placed at the top of the list.\r
194     </para>\r
195   </section>\r
196   <section id="Comparetwofilesets">\r
197     <title>Compare two file sets</title>\r
198     <para>Sometimes it is useful to compare one group of files to another, different group of files. Enable this check box to compare two groups of files. When enabled, a second list will appear and files can be added to this list using the same methods for the main list.</para>\r
199     <para>When comparing two file sets the results list will display matches between the two lists. For each match group, the first file is always from the main group, and the remaining files are always from the second group.</para>\r
200   </section>\r
201   <section id="DragandDrop">\r
202     <title>Drag and Drop</title>\r
203     <para>Drag and drop can be initiated with the primary or middle mouse buttons. Dragging a file that is selected will include all selected files in the drag. Dragging a file that is not selected will first change the selection to the dragged file, and clear the previous selection.</para>\r
204   </section>\r
205   <section id="ImageDataWindow">\r
206     <title>Image Data Window</title>\r
207     <para>\r
208       <code>Ctrl+Shift+Right Mouse click</code>\r
209       : Use this to display a dialog containing the data stored for the clicked image file. This is usually only useful for debugging purposes.\r
210     </para>\r
211     <para />\r
212   </section>\r
213 </section>\r