dic = {}
for palavra in texto:
palavra = palavra.strip()
if item in dic:
dic[palavra] +=1
else:
dic[palavra] = 0
Assim, cada palavra única será inserida e devidamente contada.
dic = {}
for palavra in texto:
palavra = palavra.strip()
if item in dic:
dic[palavra] +=1
else:
dic[palavra] = 0
Assim, cada palavra única será inserida e devidamente contada.
df = df.fillna(0) # substitui Nan por zero em todas as colunas e linhas
df[colluna]
linhas = df.shape[0]
colunas = df.shape[1]
Sendo df um dataframe do pandas. A shape é uma propriedade do dataframe: df.shape(linha,coluna)
registro = db.loc[db['suaString'].str.startswith(item)] # todos os registros que começam com item
Se você conhece o registro, tipo quero achar o Nome José na lista para obter outros dados (por exemplo, a idade do José)
# Abra o arquivo:
import pandas as pd
bd = pd.read_csv('metadadosParaExperimento1.csv',sep=';')
Configure a coluna 'Nome' como index:
bd = bd.set_index('nome') # só pode ser executada uma vez a cada abertura do arquivo
registro = bd.loc['José']
print(registro.idade) #
Se o separador for ponto-e-vírgula (Exemplo: maria;35;casada):
import pandas as pd
bd = pd.read_csv('arquivo.csv',sep=';')
Se o separador for vírgula:
import pandas as pd
bd = pd.read_csv('arquivo.csv',sep=',')
Use o comando bd.head(5) para ver as 5 primeiras linhas de dados.
plt.savefig('filename.png', dpi=300)
Você pode usar valores menores dpi =200, por exemplo. É só alterar o valor de dpi
plt.savefig('test.png', bbox_inches='tight')
Ou pode ajustar na unha:
plt.subplots_adjust(left=0.1,right=0.9,top=0.9,bottom=0.1)
Exemplo de gráfico sem margem:import matplotlib.pyplot as pltimport numpy as np
data = np.arange(3000).reshape((100,30))
plt.imshow(data)
plt.savefig('test.png', bbox_inches='tight')
import re texto = re.sub('<[^>]+?>', '', texto)