Data Programming Course  Check-in [41e97fa514]

Many hyperlinks are disabled.
Use anonymous login to enable hyperlinks.

Overview
Comment:corretta la visualizzazione delle slide dell'esercitazione finale
Downloads: Tarball | ZIP archive
Timelines: family | ancestors | trunk
Files: files | file ages | folders
SHA1: 41e97fa514c8bac09c36d594eb782830bc5b09b1
User & Date: EnricoGiampieri 2017-03-17 09:20:37.837
Context
2017-03-17
09:20
corretta la visualizzazione delle slide dell'esercitazione finale Leaf check-in: 41e97fa514 user: EnricoGiampieri tags: trunk
09:17
terminate le slide dell'esercitazione finale check-in: 57209fe163 user: EnricoGiampieri tags: trunk
Changes
Unified Diff Ignore Whitespace Patch
Changes to Esercitazione finale.html.
11848
11849
11850
11851
11852
11853
11854









11855
11856
11857
11858
11859
11860
11861
<div class="cell border-box-sizing text_cell rendered">
<div class="prompt input_prompt">
</div>
<div class="inner_cell">
<div class="text_cell_render border-box-sizing rendered_html">
<h2 id="file-di-riferimento">file di riferimento<a class="anchor-link" href="#file-di-riferimento">&#182;</a></h2><h3 id="fisica-delle-alte-energie,-sperimentale">fisica delle alte energie, sperimentale<a class="anchor-link" href="#fisica-delle-alte-energie,-sperimentale">&#182;</a></h3><h4 id="collegamenti-fra-gli-ID-degli-articoli">collegamenti fra gli ID degli articoli<a class="anchor-link" href="#collegamenti-fra-gli-ID-degli-articoli">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepPh.txt.gz">http://snap.stanford.edu/data/cit-HepPh.txt.gz</a></p>
<h4 id="data-di-pubblicazione-degli-articoli">data di pubblicazione degli articoli<a class="anchor-link" href="#data-di-pubblicazione-degli-articoli">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepPh-dates.txt.gz">http://snap.stanford.edu/data/cit-HepPh-dates.txt.gz</a></p>









<h3 id="fisica-delle-alte-energie,-teorica">fisica delle alte energie, teorica<a class="anchor-link" href="#fisica-delle-alte-energie,-teorica">&#182;</a></h3><h4 id="collegamenti-fra-gli-ID-degli-articoli">collegamenti fra gli ID degli articoli<a class="anchor-link" href="#collegamenti-fra-gli-ID-degli-articoli">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepTh.txt.gz">http://snap.stanford.edu/data/cit-HepTh.txt.gz</a></p>
<h4 id="data-di-pubblicazione-degli-articoli">data di pubblicazione degli articoli<a class="anchor-link" href="#data-di-pubblicazione-degli-articoli">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepTh-dates.txt.gz">http://snap.stanford.edu/data/cit-HepTh-dates.txt.gz</a></p>
<h4 id="abstract-degli-articoli-con-gli-autori">abstract degli articoli con gli autori<a class="anchor-link" href="#abstract-degli-articoli-con-gli-autori">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepTh-abstracts.tar.gz">http://snap.stanford.edu/data/cit-HepTh-abstracts.tar.gz</a></p>

</div>
</div>
</div>







>
>
>
>
>
>
>
>
>







11848
11849
11850
11851
11852
11853
11854
11855
11856
11857
11858
11859
11860
11861
11862
11863
11864
11865
11866
11867
11868
11869
11870
<div class="cell border-box-sizing text_cell rendered">
<div class="prompt input_prompt">
</div>
<div class="inner_cell">
<div class="text_cell_render border-box-sizing rendered_html">
<h2 id="file-di-riferimento">file di riferimento<a class="anchor-link" href="#file-di-riferimento">&#182;</a></h2><h3 id="fisica-delle-alte-energie,-sperimentale">fisica delle alte energie, sperimentale<a class="anchor-link" href="#fisica-delle-alte-energie,-sperimentale">&#182;</a></h3><h4 id="collegamenti-fra-gli-ID-degli-articoli">collegamenti fra gli ID degli articoli<a class="anchor-link" href="#collegamenti-fra-gli-ID-degli-articoli">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepPh.txt.gz">http://snap.stanford.edu/data/cit-HepPh.txt.gz</a></p>
<h4 id="data-di-pubblicazione-degli-articoli">data di pubblicazione degli articoli<a class="anchor-link" href="#data-di-pubblicazione-degli-articoli">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepPh-dates.txt.gz">http://snap.stanford.edu/data/cit-HepPh-dates.txt.gz</a></p>

</div>
</div>
</div>
<div class="cell border-box-sizing text_cell rendered">
<div class="prompt input_prompt">
</div>
<div class="inner_cell">
<div class="text_cell_render border-box-sizing rendered_html">
<h3 id="fisica-delle-alte-energie,-teorica">fisica delle alte energie, teorica<a class="anchor-link" href="#fisica-delle-alte-energie,-teorica">&#182;</a></h3><h4 id="collegamenti-fra-gli-ID-degli-articoli">collegamenti fra gli ID degli articoli<a class="anchor-link" href="#collegamenti-fra-gli-ID-degli-articoli">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepTh.txt.gz">http://snap.stanford.edu/data/cit-HepTh.txt.gz</a></p>
<h4 id="data-di-pubblicazione-degli-articoli">data di pubblicazione degli articoli<a class="anchor-link" href="#data-di-pubblicazione-degli-articoli">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepTh-dates.txt.gz">http://snap.stanford.edu/data/cit-HepTh-dates.txt.gz</a></p>
<h4 id="abstract-degli-articoli-con-gli-autori">abstract degli articoli con gli autori<a class="anchor-link" href="#abstract-degli-articoli-con-gli-autori">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepTh-abstracts.tar.gz">http://snap.stanford.edu/data/cit-HepTh-abstracts.tar.gz</a></p>

</div>
</div>
</div>
Changes to Esercitazione finale.ipynb.
96
97
98
99
100
101
102
103



104








105
106
107
108
109
110
111
    "\n",
    "#### collegamenti fra gli ID degli articoli\n",
    "\n",
    "http://snap.stanford.edu/data/cit-HepPh.txt.gz\n",
    "\n",
    "#### data di pubblicazione degli articoli\n",
    "\n",
    "http://snap.stanford.edu/data/cit-HepPh-dates.txt.gz\n",



    "\n",








    "### fisica delle alte energie, teorica\n",
    "\n",
    "#### collegamenti fra gli ID degli articoli\n",
    "\n",
    "http://snap.stanford.edu/data/cit-HepTh.txt.gz\n",
    "\n",
    "#### data di pubblicazione degli articoli\n",







|
>
>
>
|
>
>
>
>
>
>
>
>







96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
    "\n",
    "#### collegamenti fra gli ID degli articoli\n",
    "\n",
    "http://snap.stanford.edu/data/cit-HepPh.txt.gz\n",
    "\n",
    "#### data di pubblicazione degli articoli\n",
    "\n",
    "http://snap.stanford.edu/data/cit-HepPh-dates.txt.gz"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "deletable": true,
    "editable": true,
    "slideshow": {
     "slide_type": "slide"
    }
   },
   "source": [
    "### fisica delle alte energie, teorica\n",
    "\n",
    "#### collegamenti fra gli ID degli articoli\n",
    "\n",
    "http://snap.stanford.edu/data/cit-HepTh.txt.gz\n",
    "\n",
    "#### data di pubblicazione degli articoli\n",
142
143
144
145
146
147
148


149
150
151
152
153
154
155
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {
    "collapsed": false,


    "slideshow": {
     "slide_type": "skip"
    }
   },
   "outputs": [
    {
     "data": {







>
>







153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {
    "collapsed": false,
    "deletable": true,
    "editable": true,
    "slideshow": {
     "slide_type": "skip"
    }
   },
   "outputs": [
    {
     "data": {
166
167
168
169
170
171
172


173
174
175
176
177
178
179
180
181
182
183
184
185


186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202


203
204
205
206
207
208
209
210
211
212
213
214
215
216
217


218
219
220
221
222
223
224
225
226
227
228
229
230


231
232
233
234
235
236
237
238
239
240


241
242
243
244
245
246
247
248
249
250
251
252
253


254
255
256
257
258
259
260
    "import os\n",
    "os.getcwd()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {


    "slideshow": {
     "slide_type": "slide"
    }
   },
   "source": [
    "vediamo scaricare ed estrarre i file con python3, usando solo le librerie di base"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {
    "collapsed": true,


    "slideshow": {
     "slide_type": "fragment"
    }
   },
   "outputs": [],
   "source": [
    "from urllib.request import urlretrieve\n",
    "url = \"http://snap.stanford.edu/data/\"\n",
    "filename = \"cit-HepPh.txt.gz\"\n",
    "local_filename, headers = urlretrieve(url+filename, filename)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 9,
   "metadata": {
    "collapsed": false,


    "slideshow": {
     "slide_type": "fragment"
    }
   },
   "outputs": [],
   "source": [
    "import gzip\n",
    "with gzip.open('cit-HepPh.txt.gz', 'rb') as source:\n",
    "    with open('cit-HepPh_python.txt', 'wb') as destination:\n",
    "        destination.write(source.read())"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {


    "slideshow": {
     "slide_type": "fragment"
    }
   },
   "source": [
    "in generale posso estrarre gli archivi in modo più facile, ma per qualche motivo a me oscuro il formato \".gz\" puro non sembra essere supportato direttamente."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": false


   },
   "outputs": [],
   "source": [
    "from shutil import unpack_archive\n",
    "unpack_archive(filename)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {


    "slideshow": {
     "slide_type": "slide"
    }
   },
   "source": [
    "dalla linea di comando posso usare i comandi wget ed gunzip"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {
    "collapsed": false,


    "slideshow": {
     "slide_type": "fragment"
    }
   },
   "outputs": [
    {
     "name": "stdout",







>
>













>
>

















>
>















>
>












|
>
>










>
>













>
>







179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
    "import os\n",
    "os.getcwd()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "deletable": true,
    "editable": true,
    "slideshow": {
     "slide_type": "slide"
    }
   },
   "source": [
    "vediamo scaricare ed estrarre i file con python3, usando solo le librerie di base"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {
    "collapsed": true,
    "deletable": true,
    "editable": true,
    "slideshow": {
     "slide_type": "fragment"
    }
   },
   "outputs": [],
   "source": [
    "from urllib.request import urlretrieve\n",
    "url = \"http://snap.stanford.edu/data/\"\n",
    "filename = \"cit-HepPh.txt.gz\"\n",
    "local_filename, headers = urlretrieve(url+filename, filename)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 9,
   "metadata": {
    "collapsed": false,
    "deletable": true,
    "editable": true,
    "slideshow": {
     "slide_type": "fragment"
    }
   },
   "outputs": [],
   "source": [
    "import gzip\n",
    "with gzip.open('cit-HepPh.txt.gz', 'rb') as source:\n",
    "    with open('cit-HepPh_python.txt', 'wb') as destination:\n",
    "        destination.write(source.read())"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "deletable": true,
    "editable": true,
    "slideshow": {
     "slide_type": "fragment"
    }
   },
   "source": [
    "in generale posso estrarre gli archivi in modo più facile, ma per qualche motivo a me oscuro il formato \".gz\" puro non sembra essere supportato direttamente."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": false,
    "deletable": true,
    "editable": true
   },
   "outputs": [],
   "source": [
    "from shutil import unpack_archive\n",
    "unpack_archive(filename)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "deletable": true,
    "editable": true,
    "slideshow": {
     "slide_type": "slide"
    }
   },
   "source": [
    "dalla linea di comando posso usare i comandi wget ed gunzip"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {
    "collapsed": false,
    "deletable": true,
    "editable": true,
    "slideshow": {
     "slide_type": "fragment"
    }
   },
   "outputs": [
    {
     "name": "stdout",
295
296
297
298
299
300
301


302
303
304
305
306
307
308
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 10,
   "metadata": {
    "collapsed": false,


    "slideshow": {
     "slide_type": "fragment"
    }
   },
   "outputs": [
    {
     "name": "stdout",







>
>







322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 10,
   "metadata": {
    "collapsed": false,
    "deletable": true,
    "editable": true,
    "slideshow": {
     "slide_type": "fragment"
    }
   },
   "outputs": [
    {
     "name": "stdout",
317
318
319
320
321
322
323


324
325
326
327
328
329
330
    "!md5sum cit-HepPh.txt\n",
    "!md5sum cit-HepPh_python.txt"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {


    "slideshow": {
     "slide_type": "slide"
    }
   },
   "source": [
    "Per chi volesse scaricare il file degli abstract, non essendo in formato gz, è necessario usare il comando `tar` invece di `gunzip`."
   ]







>
>







346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
    "!md5sum cit-HepPh.txt\n",
    "!md5sum cit-HepPh_python.txt"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "deletable": true,
    "editable": true,
    "slideshow": {
     "slide_type": "slide"
    }
   },
   "source": [
    "Per chi volesse scaricare il file degli abstract, non essendo in formato gz, è necessario usare il comando `tar` invece di `gunzip`."
   ]
Changes to Esercitazione finale.slides.html.
11929
11930
11931
11932
11933
11934
11935









11936
11937
11938
11939
11940
11941
11942
<div class="cell border-box-sizing text_cell rendered">
<div class="prompt input_prompt">
</div>
<div class="inner_cell">
<div class="text_cell_render border-box-sizing rendered_html">
<h2 id="file-di-riferimento">file di riferimento<a class="anchor-link" href="#file-di-riferimento">&#182;</a></h2><h3 id="fisica-delle-alte-energie,-sperimentale">fisica delle alte energie, sperimentale<a class="anchor-link" href="#fisica-delle-alte-energie,-sperimentale">&#182;</a></h3><h4 id="collegamenti-fra-gli-ID-degli-articoli">collegamenti fra gli ID degli articoli<a class="anchor-link" href="#collegamenti-fra-gli-ID-degli-articoli">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepPh.txt.gz">http://snap.stanford.edu/data/cit-HepPh.txt.gz</a></p>
<h4 id="data-di-pubblicazione-degli-articoli">data di pubblicazione degli articoli<a class="anchor-link" href="#data-di-pubblicazione-degli-articoli">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepPh-dates.txt.gz">http://snap.stanford.edu/data/cit-HepPh-dates.txt.gz</a></p>









<h3 id="fisica-delle-alte-energie,-teorica">fisica delle alte energie, teorica<a class="anchor-link" href="#fisica-delle-alte-energie,-teorica">&#182;</a></h3><h4 id="collegamenti-fra-gli-ID-degli-articoli">collegamenti fra gli ID degli articoli<a class="anchor-link" href="#collegamenti-fra-gli-ID-degli-articoli">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepTh.txt.gz">http://snap.stanford.edu/data/cit-HepTh.txt.gz</a></p>
<h4 id="data-di-pubblicazione-degli-articoli">data di pubblicazione degli articoli<a class="anchor-link" href="#data-di-pubblicazione-degli-articoli">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepTh-dates.txt.gz">http://snap.stanford.edu/data/cit-HepTh-dates.txt.gz</a></p>
<h4 id="abstract-degli-articoli-con-gli-autori">abstract degli articoli con gli autori<a class="anchor-link" href="#abstract-degli-articoli-con-gli-autori">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepTh-abstracts.tar.gz">http://snap.stanford.edu/data/cit-HepTh-abstracts.tar.gz</a></p>

</div>
</div>
</div></section></section><section><section>







>
>
>
>
>
>
>
>
>







11929
11930
11931
11932
11933
11934
11935
11936
11937
11938
11939
11940
11941
11942
11943
11944
11945
11946
11947
11948
11949
11950
11951
<div class="cell border-box-sizing text_cell rendered">
<div class="prompt input_prompt">
</div>
<div class="inner_cell">
<div class="text_cell_render border-box-sizing rendered_html">
<h2 id="file-di-riferimento">file di riferimento<a class="anchor-link" href="#file-di-riferimento">&#182;</a></h2><h3 id="fisica-delle-alte-energie,-sperimentale">fisica delle alte energie, sperimentale<a class="anchor-link" href="#fisica-delle-alte-energie,-sperimentale">&#182;</a></h3><h4 id="collegamenti-fra-gli-ID-degli-articoli">collegamenti fra gli ID degli articoli<a class="anchor-link" href="#collegamenti-fra-gli-ID-degli-articoli">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepPh.txt.gz">http://snap.stanford.edu/data/cit-HepPh.txt.gz</a></p>
<h4 id="data-di-pubblicazione-degli-articoli">data di pubblicazione degli articoli<a class="anchor-link" href="#data-di-pubblicazione-degli-articoli">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepPh-dates.txt.gz">http://snap.stanford.edu/data/cit-HepPh-dates.txt.gz</a></p>

</div>
</div>
</div></section></section><section><section>
<div class="cell border-box-sizing text_cell rendered">
<div class="prompt input_prompt">
</div>
<div class="inner_cell">
<div class="text_cell_render border-box-sizing rendered_html">
<h3 id="fisica-delle-alte-energie,-teorica">fisica delle alte energie, teorica<a class="anchor-link" href="#fisica-delle-alte-energie,-teorica">&#182;</a></h3><h4 id="collegamenti-fra-gli-ID-degli-articoli">collegamenti fra gli ID degli articoli<a class="anchor-link" href="#collegamenti-fra-gli-ID-degli-articoli">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepTh.txt.gz">http://snap.stanford.edu/data/cit-HepTh.txt.gz</a></p>
<h4 id="data-di-pubblicazione-degli-articoli">data di pubblicazione degli articoli<a class="anchor-link" href="#data-di-pubblicazione-degli-articoli">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepTh-dates.txt.gz">http://snap.stanford.edu/data/cit-HepTh-dates.txt.gz</a></p>
<h4 id="abstract-degli-articoli-con-gli-autori">abstract degli articoli con gli autori<a class="anchor-link" href="#abstract-degli-articoli-con-gli-autori">&#182;</a></h4><p><a href="http://snap.stanford.edu/data/cit-HepTh-abstracts.tar.gz">http://snap.stanford.edu/data/cit-HepTh-abstracts.tar.gz</a></p>

</div>
</div>
</div></section></section><section><section>