<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	xmlns:georss="http://www.georss.org/georss" xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#" xmlns:media="http://search.yahoo.com/mrss/"
	>

<channel>
	<title>Vinícius Souza () &#187; Software Livre</title>
	<atom:link href="http://vsouza.wordpress.com/category/software-livre/feed/" rel="self" type="application/rss+xml" />
	<link>http://vsouza.wordpress.com</link>
	<description>... Nerdisses em geral ...</description>
	<lastBuildDate>Sat, 21 Jun 2008 20:09:42 +0000</lastBuildDate>
	<generator>http://wordpress.com/</generator>
	<language>pt-br</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<cloud domain='vsouza.wordpress.com' port='80' path='/?rsscloud=notify' registerProcedure='' protocol='http-post' />
<image>
		<url>http://www.gravatar.com/blavatar/59ee686b5c907e371b25ac449db50381?s=96&#038;d=http://s.wordpress.com/i/buttonw-com.png</url>
		<title>Vinícius Souza () &#187; Software Livre</title>
		<link>http://vsouza.wordpress.com</link>
	</image>
	<atom:link rel="search" type="application/opensearchdescription+xml" href="http://vsouza.wordpress.com/osd.xml" title="Vinícius Souza ()" />
		<item>
		<title>Natural Language Toolkit (NLTK)</title>
		<link>http://vsouza.wordpress.com/2008/05/05/natural-language-toolkit-nltk/</link>
		<comments>http://vsouza.wordpress.com/2008/05/05/natural-language-toolkit-nltk/#comments</comments>
		<pubDate>Mon, 05 May 2008 04:51:57 +0000</pubDate>
		<dc:creator>Vinícius Souza</dc:creator>
				<category><![CDATA[Python]]></category>
		<category><![CDATA[Software Livre]]></category>
		<category><![CDATA[nltk]]></category>
		<category><![CDATA[pln]]></category>

		<guid isPermaLink="false">http://vsouza.wordpress.com/?p=18</guid>
		<description><![CDATA[Primeiramente vou explicar o que é o NLTK e como podemos instalá-lo no Linux.
Natural Language Toolkit (NLTK) é um conjunto de ferramentas open source escritas em Python e para Python, para a manipulação de linguagem natural.
Conta com uma boa documentação (http://nltk.sourceforge.net/index.php/Book) que auxilia o desenvolvimento, composto por leitores de corpus, tokenizers, stemmers, taggers, chunkers, parsers, [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=vsouza.wordpress.com&blog=3586464&post=18&subd=vsouza&ref=&feed=1" />]]></description>
			<content:encoded><![CDATA[<div class='snap_preview'><br /><p>Primeiramente vou explicar o que é o NLTK e como podemos instalá-lo no Linux.<br />
Natural Language Toolkit (NLTK) é um conjunto de ferramentas open source escritas em Python e para Python, para a manipulação de linguagem natural.</p>
<p>Conta com uma boa documentação (<a title="http://nltk.sourceforge.net/index.php/Book" href="http://nltk.sourceforge.net/index.php/Book" target="_blank">http://nltk.sourceforge.net/index.php/Book</a>) que auxilia o desenvolvimento, composto por leitores de corpus, tokenizers, stemmers, taggers, chunkers, parsers, wordnet, mais de 30 conjuntos de dados anotados amplamente usados de PLN (+300Mb).</p>
<p>Quando a manipulação com strings começa a ser tornar trabalhosa utilizando apenas o módulo String do Python, é a hora do NLTK entrar em cena.</p>
<p><strong>INSTALAÇÃO</strong></p>
<p>A instalação é bem simples, ter o Python instalado é um requisito.</p>
<p>Faça o download do código fonte em: <a title="http://prdownloads.sourceforge.net/nltk/nltk-0.9.2.tar.gz" href="http://prdownloads.sourceforge.net/nltk/nltk-0.9.2.tar.gz" target="_blank">http://prdownloads.sourceforge.net/nltk/nltk-0.9.2.tar.gz</a></p>
<p>Descompacte:<br />
<code>$ tar -zxvf nltk-0.9.2.tar.gz</code></p>
<p>Entre na pasta:<br />
<code>$ cd nltk-0.9.2</code></p>
<p>Utilize o instalador:<br />
<code>$ sudo python setup.py install</code></p>
<p>Isso feito, agora é necessário realizar um download maior (75MB) com os dados do NLTK: <a title="http://prdownloads.sourceforge.net/nltk/nltk-data-0.9.2.zip" href="http://prdownloads.sourceforge.net/nltk/nltk-data-0.9.2.zip" target="_blank">http://prdownloads.sourceforge.net/nltk/nltk-data-0.9.2.zip</a></p>
<p>Enquanto o download não termina, você pode criar a seguinte pasta:<br />
<code>$ sudo mkdir /usr/share/nltk</code></p>
<p>Após o término e descompactação dos arquivos, mova a pasta descompactada:<br />
<code>$ sudo mv data /usr/share/nltk</code></p>
<p>Altere a permissão da pasta para que os dados possam ser utilizados:<br />
<code>$ sudo chmod -R g+r /usr/share/nltk/data</code></p>
<p style="text-align:center;"><strong>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;<br />
</strong></p>
<p style="text-align:center;"><strong>Pronto, instalação completa no Linux!</strong></p>
<p style="text-align:center;"><strong>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-</strong></p>
<p>Para utilizá-la, você deve importar o módulo no Python:<br />
<code>$ python<br />
&gt;&gt;&gt;import nltk</code></p>
<p>Existe um corpus em português que pode ser utilizado da seguinte forma:<br />
<code>&gt;&gt;&gt;from nltk.corpus import floresta</code></p>
<p>Vamos coletar as palavras pertencentes a esse corpus:<br />
<code>&gt;&gt;&gt;palavras = floresta.words()</code></p>
<p>Temos 211.852 palavras:<br />
<code>&gt;&gt;&gt;len(palavras)</code></p>
<p>Por enquanto é só isso, pretendo em um próximo post apresentar alguma coisa interessante desse módulo.<br />
Como ainda não o estudei muito bem, não tenho muita coisa. Mas como terei de usá-lo em meu Trabalho de Conclusão de Curso (Investigação e Implementação De Um Sistema Gerador de Expressões Regulares A Partir De Um Conjunto De Expressões Em Linguagem Natural) provavelmente terei alguma coisa para mostrar em breve e quem sabe também não falo sobre o meu TCC.</p>
<p><strong>Referências:</strong><br />
<a title="http://nltk.sourceforge.net/" href="http://nltk.sourceforge.net/" target="_blank">http://nltk.sourceforge.net/</a></p>
<img alt="" border="0" src="http://feeds.wordpress.com/1.0/categories/vsouza.wordpress.com/18/" /> <img alt="" border="0" src="http://feeds.wordpress.com/1.0/tags/vsouza.wordpress.com/18/" /> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/vsouza.wordpress.com/18/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/vsouza.wordpress.com/18/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/vsouza.wordpress.com/18/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/vsouza.wordpress.com/18/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/vsouza.wordpress.com/18/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/vsouza.wordpress.com/18/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/vsouza.wordpress.com/18/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/vsouza.wordpress.com/18/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/vsouza.wordpress.com/18/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/vsouza.wordpress.com/18/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=vsouza.wordpress.com&blog=3586464&post=18&subd=vsouza&ref=&feed=1" /></div>]]></content:encoded>
			<wfw:commentRss>http://vsouza.wordpress.com/2008/05/05/natural-language-toolkit-nltk/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://0.gravatar.com/avatar/e02b05b2048cc2f6fbfd6aa08d9fedb7?s=96&#38;d=identicon" medium="image">
			<media:title type="html">vsouza</media:title>
		</media:content>
	</item>
		<item>
		<title>FLISOL &#8211; edição Maringá</title>
		<link>http://vsouza.wordpress.com/2008/04/27/flisol-edicao-maringa/</link>
		<comments>http://vsouza.wordpress.com/2008/04/27/flisol-edicao-maringa/#comments</comments>
		<pubDate>Sun, 27 Apr 2008 01:37:42 +0000</pubDate>
		<dc:creator>Vinícius Souza</dc:creator>
				<category><![CDATA[Software Livre]]></category>

		<guid isPermaLink="false">http://vsouza.wordpress.com/?p=8</guid>
		<description><![CDATA[Hoje foi realizado o FLISOL (Festival Latino americano de Instalação de Software Livre) 2008 Maringá, com cerca de 50 pessoas presentes.
Além de instalação e distribuição gratuita de CD&#8217;s, principalmente do Ubuntu 8.04 (lançado apenas 2 dias atrás), ocorreram palestras sobre Python do meu amigo Rodrigo Hübner, que mostrou diversas características da linguagem com exemplos práticos [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=vsouza.wordpress.com&blog=3586464&post=8&subd=vsouza&ref=&feed=1" />]]></description>
			<content:encoded><![CDATA[<div class='snap_preview'><br /><p style="text-align:left;">Hoje foi realizado o <strong>FLISOL</strong> (Festival Latino americano de Instalação de Software Livre) <strong>2008 Maringá</strong>, com cerca de 50 pessoas presentes.<br />
Além de instalação e distribuição gratuita de CD&#8217;s, principalmente do <a href="http://www.ubuntu.com" target="_blank">Ubuntu</a> 8.04 (lançado apenas 2 dias atrás), ocorreram palestras sobre Python do meu amigo <a href="http://rodrigohubner.com" target="_blank">Rodrigo Hübner</a>, que mostrou diversas características da linguagem com exemplos práticos e creio que incentivou algumas pessoas a pelo menos conhecê-la melhor.</p>
<p style="text-align:center;"><a href="http://vsouza.files.wordpress.com/2008/04/p10205851.jpg"><img class="size-medium wp-image-12 aligncenter" src="http://vsouza.files.wordpress.com/2008/04/p10205851.jpg?w=168&#038;h=300" alt="" width="168" height="300" /></a></p>
<p style="text-align:center;">O <a href="http://andrenoel.com.br" target="_blank">André Noel</a> realizou duas palestras, sobre a filosofia software livre e apresentou as novas funcionalidades do novo Ubuntu.</p>
<p style="text-align:center;"><a href="http://vsouza.files.wordpress.com/2008/04/p1020579.jpg"><img class="alignnone size-medium wp-image-13" src="http://vsouza.files.wordpress.com/2008/04/p1020579.jpg?w=300&#038;h=168" alt="" width="300" height="168" /></a></p>
<p style="text-align:center;"><img class="aligncenter" src="http://vsouza.files.wordpress.com/2008/04/p1020579" alt="" /></p>
<p style="text-align:left;">Outra palestra do dia foi do Eduardo Pezutti sobre o sistema gerenciador de conteúdo (CMS): Drupal. Voltado para a linguagem PHP.</p>
<p style="text-align:left;">Por último, o Lucas Veloso apresentou diversas alternativas livres para a administração de ambientes heterogêneos. Ferramentas para verificação de integridade/recuperação de HD, memória, cópia de sistemas operacionais em ISO (bem legal o System Imager).</p>
<p style="text-align:left;">Saldo positivo p/ evento e p/ SL!</p>
<img alt="" border="0" src="http://feeds.wordpress.com/1.0/categories/vsouza.wordpress.com/8/" /> <img alt="" border="0" src="http://feeds.wordpress.com/1.0/tags/vsouza.wordpress.com/8/" /> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/vsouza.wordpress.com/8/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/vsouza.wordpress.com/8/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/vsouza.wordpress.com/8/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/vsouza.wordpress.com/8/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/vsouza.wordpress.com/8/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/vsouza.wordpress.com/8/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/vsouza.wordpress.com/8/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/vsouza.wordpress.com/8/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/vsouza.wordpress.com/8/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/vsouza.wordpress.com/8/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=vsouza.wordpress.com&blog=3586464&post=8&subd=vsouza&ref=&feed=1" /></div>]]></content:encoded>
			<wfw:commentRss>http://vsouza.wordpress.com/2008/04/27/flisol-edicao-maringa/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://0.gravatar.com/avatar/e02b05b2048cc2f6fbfd6aa08d9fedb7?s=96&#38;d=identicon" medium="image">
			<media:title type="html">vsouza</media:title>
		</media:content>

		<media:content url="http://vsouza.files.wordpress.com/2008/04/p10205851.jpg?w=168" medium="image" />

		<media:content url="http://vsouza.files.wordpress.com/2008/04/p1020579.jpg?w=300" medium="image" />

		<media:content url="http://vsouza.files.wordpress.com/2008/04/p1020579" medium="image" />
	</item>
	</channel>
</rss>