Análise e Técnicas de Algoritmos
Período 2003.1

Problemas de Otimização e Estratégia Gulosa

Problemas de Otimização

Problemas que podem apresentar diversas soluções.
A solução é uma sequência de decisões.
Um valor pode ser associado para cada solução.
Achar a solução com valor ótimo.

Exemplo 1: Cálculo do trôco

Descrição: Seja $E = \{ e_1, e_2, ..., e_n \}, e_1 \rangle e_2 \rangle ... \rangle e_n$ , um conjunto de denominações de moedas (ou cédulas), e um valor positivo que representa o trôco.
Problema: Fornecer o montante com o número mínimo de moedas.
Sequência de Decisões: Escolher , depois , ...

Exemplo 2: Problema da Mochila (Knapsack)

Descrição: Temos objetos com pesos e uma mochila de capacidade . Se uma fração $x_i (0 \leq x_i \leq 1)$ do objeto for colocada na mochila, um lucro resulta.
Problema: Maximizar o lucro que pode ser levado na mochila.
Sequência de Decisões: Escolher primeiro objeto, escolher o segundo objeto, ...

Exemplo 3: Intercalação de Arquivos Ordenados

Descrição: Dados arquivos, onde o arquivo contém registros. Intercalar os arquivos.
Problema: Achar uma sequência de intercalação de pares de arquivos de forma a obter um único arquivo ordenado em tempo mínimo.
Sequência de Decisões: Qual o primeiro par a intercalar, qual o segundo par, ...

Exemplo 4: Escalonamento de Tarefas

Descrição: Seja um conjunto de tarefas. Associamos à cada tarefa um tempo de execução. Fazer o escalonamento dessas tarefas.
Problema: Minimizar o tempo médio de finalização das tarefas.
Sequência de Decisões: Escolher primeira tarefa, escolher a segunda tarefa, ...

Exemplo 5: Caixeiro Viajante

Descrição: Seja um grafo direcionado com custo $c_{ij}$ para os arcos. Seja o número de vértices e o vértice de origem.
Problema: Achar uma tournê de de custo mínimo, onde uma tournê é um ciclo direcionado que inclua todos os vértices de .
Sequência de Decisões: A partir da origem , qual é o primeiro vértice do ciclo, qual é o segundo vértice do ciclo, ...

O Método Guloso (Greedy)

Problema solucionado em diferentes passos.
As decisões são tomadas de forma isolada, em cada passo.
Estratégia de pegar o melhor no momento (solução ótima local).
Quando o algoritmo termina, espera-se que tenha ocorrido a melhor solução.
Com este tipo de algoritmo, podemos achar uma solução ótima para alguns problemas, mas não para todos.

Exemplos

Cálculo do Trôco

Sejam $E= \{ 100, 50, 10, 5, 1 \}$ e o montante total.
Algoritmo Greedy: No passo , escolher , tal que $e_j \leq M$ e $e_{j - 1} > M$ e subtrair de para o próximo passo.
Podemos provar que, para este conjunto de moedas , o algoritmo greedy fornece uma solução ótima.
Para $E= \{300, 250, 100, 1 \}$ , não funciona (exemplo: ).

Alocação de Tarefas (1)

Seja um conjunto de tarefas $J= {j_1, j_2, ..., j_n}$ com tempos de execução , respectivamente.
Considerar um único processador e alocação não-preemptiva.
Qual a melhor forma de alocar essas tarefas para minimizar o tempo médio de execução?
Solução 1: ordem de chegada.
Solução 2: ordem crescente do tempo de execução.
Usar $J= \{(j_1, 15), (j_2, 8), (j_3, 3), (j_4, 10) \}$ para ilustrar.
A solução 2 sempre apresenta solução ótima:
- Vamos supor que temos a seguinte sequência como solução. $j_{i_1}, j_{i_2}, ..., j_{i_n}$ .
- $C= t_{i_1} + (t_{i_1} + t_{i_2}) + ... + (t_{i_1} + t_{i_2} + ... + t_{i_n})$ .
- $C= \sum _{k= 1}^n (n - k + 1)t_{i_k}$ .
- $C= (n + 1). \sum _{k= 1}^n t_{i_k} - \sum _{k= 1}^n k . t_{i_k}$ .
- Vamos supor que exista uma ordenação em que e $t_{i_x} < t_{i_y}$ .
- Se fizermos a troca, o custo total vai decrescer.

Alocação de Tarefas (2)

Mesma definição do problema anterior.
Diferença: considera processadores.
Assumir que os tempos estão em ordem crescente de tempo de execução.
Exemplo: e $J= \{ (j_1, 3), (j_2, 5), (j_3, 6), \\ (j_4, 10), (j_5, 11), (j_6, 14), (j_7, 15), (j_8, 18), (j_9, 20)\}$ .
Solução: começar a alocação em ordem, fazendo um rodízio entre os processadores.
Outros arranjos podem ser efetuados
Prova é semelhante.

Alocação de Tarefas (3)

Mesma definição do problema anterior.
O objetivo é minimizar o tempo final, ou seja, o tempo em que as tarefas terminam.
No problema anterior foi 40 e 38.
Solução: $\{ (P_1, j_2, j_5, j_8), (P_2, j_6, j_9), (P_3, j_3, j_4, j_7)\}$ .
O tempo médio não é mínimo mas, a sequência inteira termina mais cedo.
Esse problema é mais complicado de se resolver.

Alocação de Tarefas (4)

Seja $S= \{ 1, 2, ..., n \}$ um conjunto de atividades que desejam usar um mesmo recurso.
Cada atividade tem um tempo de começo () e um tempo de término (), $s_i \leq f_i$ .
Duas atividades e são compatíveis se elas não se sobrepõem, ou seja, se $s_i \geq f_j$ ou $s_j \geq f_i$ .
Assumir que as atividades estão em ordem crescente do tempo de término.

$\begin{algorithmic} \STATE {\bf AlgoritmoGreedy (s, f) } \STATE \STATE $n \lefta... ...\cup \{i\}$\STATE $j = i$\ENDIF \ENDFOR \STATE return A \STATE \end{algorithmic}$

Arrays para representar e .
Prova de que está correto: mostrar que existe uma solução ótima que começa com a atividade .

Elementos do Método Guloso

Um algoritmo guloso obtém uma solução ótima para um problema, fazendo uma sequência de escolhas.
Nem sempre produz uma solução ótima.
Não existe uma regra geral que indique que um algoritmo guloso resolva um determinado problema de otimização.
Bom indício é dado por 2 elementos:
- Propriedade de escolha gulosa.
- Sub-estrutura ótima.

Mais Exemplos

Problema da Mochila Fracionária

Considere objetos com pesos e uma mochila de capacidade . Se uma fração $x_i (0 \leq x_i \leq 1)$ do objeto for colocada na mochila, um lucro de é conseguido. Como maximizar o lucro.

Vamos usar o seguinte exemplo:

Solução 1: Maximizar o lucro a cada passo

Escolher o objeto com máximo e colocar na mochila (). No último passo, quando a mochila está quase cheia, escolher o objeto , tal que complete a capacidade da mochila e seja máximo.

Escolher o de maior lucro ( ). O lucro até então é 25 e a capcidade restante da mochila é 2.
O objeto 2 não cabe por inteiro. Usar que dá um lucro de 3,2.
A solução permite um lucro de 28,2.

Solução 2: Conserva a capacidade

Escolher os objetos em ordem crescente de peso (), maximizando a capacidade restante.

. A capacidade restante é 10.
. Não é possível mais selecionar objetos.
A solução permite um lucro de 31.

Solução 3: Maximiza o lucro por unidade de peso

Escolher os objetos em ordem decrescente de .

O objeto que apresenta maior lucro por unidade de peso é o 2, seguido do 3 e do 1.
Logo: , capacidade restante é 5.
, capacidade restante é 0.
A solução permite um lucro de 31,5.

O Algoritmo

Primeiro ordenar os objetos em ordem decrescente .

$\begin{algorithmic} \STATE $cap = M$\STATE $i = 1$\WHILE{$w_i \leq cap$} \STATE ... ...ap / w_i$\FOR{$j = i + 1 to n$} \STATE $x_j = 0$\ENDFOR \STATE \end{algorithmic}$

É possível provar que o terceiro algoritmo sempre fornece a solução ótima para este problema da mochila.

Prova do Terceiro Algoritmo

O que devemos provar é que a solução fornecida pelo terceiro algoritmo corresponde à solução com o maior lucro.

É importante, entretanto, ressaltar que pode existir várias soluções ótimas.

Vamos supor que é a solução fornecida pelo algoritmo.

Se, $\forall i, 1 \leq i \leq n, x_i = 1$ , essa solução é claramente a ótima. Nesse caso, seria a única solução.

Se não for este o caso, vamos supor que é o menor número onde $x_j \neq 1$ . Do algoritmo temos:

: $x_i = 1, \forall i, 1 \leq i \leq j$
: $0 \leq x_j < 1$
: $x_i = 0, \forall j, j < i \leq n$

Logo, $\Sigma _{i=1}^j x_iw_i = M$ .

Seja uma solução de máximo lucro.

Temos que provar que tem o mesmo lucro de .

Se , não tem o que fazer.

Caso contrário, vamos considerar que é o menor número onde $x_k \neq y_k$ .

Podemos então dizer que:

: $Y = x_1 x_2 ... x_{k - 1} y_k y_{k + 1} ... y_n$
: $X = x_1 x_2 ... x_{k - 1} x_k x_{k + 1} ... x_n$

A estratégia da prova consiste em transformar em , mantendo o lucro. Para tanto, vamos transformar em uma solução mais intermediária e que se parece mais com , ou seja,

: $Z = x_1 x_2 ... x_{k - 1} x_k z_{k + 1} ... z_n$

Antes de prosseguirmos com a prova, vamos fazer algumas considerações. vamos investigar os seguintes casos:

Caso 1: .

Nesse caso, . Portanto, deve ser menor do que pois $x_k \neq y_k$ .

Caso 2: .

Pela definição de , $x_k \neq y_k$ . Se ,

$\begin{algorithmic} \STATE \STATE $M = \Sigma _{i = 1}^n y_iw_i$\STATE \hspace{0... ...a _{i = k + 1}^n y_iw_i $\STATE \hspace{0.3cm} $> M$\STATE \par\end{algorithmic}$

Isso contradiz o fato de que é uma solução. Logo, .

Caso 3: .

Nesse caso, e :

$\begin{algorithmic} \STATE \STATE $M = \Sigma _{i = 1}^n y_iw_i$\STATE \hspace{0... ...a _{i = j + 1}^n y_iw_i $\STATE \hspace{0.3cm} $> M$\STATE \par\end{algorithmic}$

Também não é possível, logo o caso 3 nunca acontece.

Portanto, podemos assumir que .

Voltando à prova, para sair de para temos que aumentar fazendo igual a . e diminuir $y_{k + 1}, ..., y_n$ como necessário, para fazer com que o lucro se mantenha. Vamos dizer que a nova solução é .

Portanto,

$\Sigma _{i = k + 1}^n (z_i - y_i)w_i < 0$
$(z_k - y_k)w_k + \Sigma _{i = k + 1}^n (z_i - y_i)w_i = 0$

Então,

$\begin{algorithmic} \STATE \STATE $\Sigma _{i = 1}^n z_ip_i$\STATE \hspace{0.3cm... ... $\STATE \hspace{0.3cm} $= \Sigma _{i = 1}^n y_ip_i$\STATE \par\end{algorithmic}$

e têm o mesmo lucro. , entretanto, se parece mais com pois as primeiras entradas de são as mesmas de .

O procedimento pode ser repetido até transformar em . Logo também é uma solução ótima.

Códigos de Huffman

Nessa seção vamos considerar uma aplicação de algoritmos gulosos, conhecida como compressão de arquivos.

Vamos considerar um arquivo de 100.000 caracteres, onde apenas os caracteres , , , , , e ocorrem com freqüência de 15000, 25000, 22000, 7000, 5000, 23000, 3000.
Usando um código para representar cada caracter:
1. Se usarmos ASCII Extendido (8 bits), o número total de bits é 800.000.
2. Se usarmos um código de tamanho fixo, 3 bits para representar 7 caracteres, o número total de bits é 300.000.
3. Se usarmos um código de tamanho variável: , , , , , e , o número total de bits é 255.000.
É possível reduzir 15% da solução 2 e 68% da solução 1.

A redução no número de bits foi possível pois a estratégia utilizada considerou um código de tamanho variável, onde os caracteres com freqüência maior eram codificados com um número menor de bits. Logo, se todos os caracteres ocorrem com a mesma freqüência, é possível que não ocorra nenhuma redução no número de bits utilizados.

Códigos de Huffman

Utilizam códigos prefixos:
- Códigos onde nenhum código de caracter é prefixo de outro.
- Sempre é possível achar um código ótimo de compressão.
- Codificação e decodificação são fáceis.
Utilização de uma árvore binária, com folhas representando os caracteres. 0 significa esquerda e 1 direita.

O Algoritmo de Huffman

Vamos assumir que o número de caracteres é .
Manter uma floresta de árvores.
O peso de uma árvore é a soma das freqüências de suas folhas.
vezes, selecionar as duas árvores de menor peso e formar uma nova árvore.
No início do algoritmo, existem árvoes de apenas um nó.
No final temos apenas uma única árvore e á a árvore com o código de Huffman.

Vamos considerar a seguinte configuração inicial:

$\epsfig{file=huffman1.eps,width=10cm}$

Resultado após o primeiro merge.

$\epsfig{file=huffman2.eps,width=12cm}$

Resultado após o segundo merge.

$\epsfig{file=huffman3.eps,width=12cm}$

Resultado após o terceiro merge.

$\epsfig{file=huffman4.eps,width=12cm}$

Resultado após o quarto merge.

$\epsfig{file=huffman5.eps,width=12cm}$

Resultado após o quinto merge.

$\epsfig{file=huffman6.eps,width=12cm}$

Resultado final.

$\epsfig{file=huffman7.eps,width=12cm}$

O código prefixo ótimo é:

Características Gerais de Algoritmos Gulosos

Como apresentado, algoritmos gulosos são utilizados para resolver problemas de otimização. Os algoritmos que se baseiam em uma estratégia gulosa são, em geral, simples e de fácil implementação. A maioria dos problemas de otimização que são resolvidos utilizando uma estratégia gulosa, tem em geral a seguinte forma:

Instâncias

Uma instância consiste de um conjunto de objetos e um relacionamento entre eles.

Soluções para uma instância

Uma solução é um subconjunto destes objetos. A estratégia gulosa define qual a forma de escolher os objetos da solução. Vale acrescentar que alguns subconjuntos não são permitidos. Essa restrição é imposta pelo relacionamento existente entre os objetos.

Custo de uma solução

Cada subconjunto válido (sem conflito) como solução tem associado um custo. Em geral, o custo é definido pelo número de objetos do subconjunto, pela soma dos custos individuais dos objetos, ou através de uma função mais complexa sobre os elementos do subconjunto.

Objetivo

Dada uma instância de um problema, o objetivo é maximizar (minimizar) o custo da solução.

Se uma solução força bruta é usada neste caso, é necessário considerar todas as possíveis soluções de uma dada instância, computar o custo de cada solução e escolher a de maior (menor) custo. Em geral, este tipo de algoritmo é de ordem exponencial.

A escolha gulosa

A escolha gulosa é aquela que salta aos olhos, ou a que primeiro vem na mente quando imaginamos um algoritmo para o problema. Dado o conjunto de objetos de entrada, a escolha gulosa seleciona um dos objetos, seguindo um critério simples (aquele que parece ser o melhor).

Com base nestas definições, é possível definir elementos que comumente fazem parte de uma solução gulosa, na tentativa de definir uma cara genérica para uma solução gulosa.

Vamos considerar o exemplo do cálculo do trôco, em um sistema monetário que apresenta o seguinte conjunto de moedas $C = \{ 100, 25, 10, 5, 1 \}$ . Uma possível solução que utiliza estratégia gulosa é apresentada abaixo:

$\begin{algorithmic} \STATE {\bf CalculaTroco(M)} \STATE $C \leftarrow \{ 100, 25... ...}$ \STATE $soma \leftarrow soma + X$\ENDWHILE \STATE return $S$\end{algorithmic}$

A solução é obtida partindo-se de um conjunto vazio de moedas e, em cada etapa, escollhendo a maior moeda possível. É possível identificar neste algoritmo os seguintes elementos:

Uma lista de candidatos, definido pelo conjunto .
Uma lista de elementos escolhidos, definido pelo conjunto .
Uma função SELEÇÃO que seleciona um dos candidatos. No nosso exemplo é a uma função que retorna a maior moeda.
Uma função VIABILIDADE que verifica a viabilidade da escolha. No exemplo, a função que testa se a soma dos valores da nova moeda escolhida com os valores das moedas previamentes escolhidas não ultrapassa o valor do montante.
Uma função SOLUÇÃO que verifica se um determinado conjunto de candidatos é uma solução para o problema. Em nosso exemplo, é a função que testa se a soma dos elementos escolhidos é igual ao montante .

Além dos elementos listados, em algumas soluções é possível identificar mais dois elementos: um conjunto de candidatos rejeitados e uma função que define o valor de uma solução (serve para definir a eficiência de uma solução. No exemplo do cálculo do trôco, essa função retorna o número de moedas utilizadas para fornecer o trôco).

Solução Genérica

Um algoritmo guloso genérico define inicialmente um conjunto vazio de candidatos escolhidos. Em cada etapa um novo elemento é escolhido da lista de candidatos e adicionado ao conjunto de candidatos escolhidos. Esta escolha é guiada pela função SELEÇÃO que através do crivo da função VIABILIDADE define se o elemento selecionado deve ser considerado ou rejeitado. Se o elemento for rejeitado ele não deve ser considerado novamente. Se o elemento é adicionado ao conjunto dos elementos escolhidos, a função SOLUÇÃO verifica se o novo conjunto corresponde a solução do problema.

$\begin{algorithmic} \STATE {\bf AlgoritmoGuloso($C$)} \STATE $C$\ é o conjunto d... ...STATE return $S$ \ELSE \STATE return(não tem solução) \ENDIF \end{algorithmic}$

Jorge C. A. de Figueiredo 2003-05-27

Análise e Técnicas de Algoritmos Período 2003.1

Análise e Técnicas de Algoritmos
Período 2003.1